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岀版说明 


由香港科技大学社会科学部吴晓刚教授主编的“格致方 
法 • 定量研究系列”丛书，精选了世界著名的 SAGE 出版社 
定量社会科学研究丛书中的35种，翻译成中文，集结成八 
册，于2011年出版。这八册书分 别是: 《线性回归分析基 
础》、《高级回归分析》、《广义线性模型》、《纵贯数据分析》、 
《因果关系模型》、《社会科学中的数理基础及应用》、《数据分 
析方法五种》和《列表数据分析》。这套丛书自出版以来，受 
到广大读者特别是年轻一代社会科学工作者的欢迎，他们针 
对丛书的内容和翻译都提出了很多中肯的建议。我们对此 
表示衷心的感谢。 

基于读者的热烈反馈，同时也为了向广大读者提供更多 
的方便和选择，我们将该丛书以单行本的形式再次出版发行。 
在此过程中，主编和译者对已出版的书做了必要的修订和校 




总序 


往事如烟，光阴如梭。转眼间，出国已然十年 有余。 
1996年赴美留学，最初选择的主攻方向是比较历史社会学， 
研究的兴趣是中国的制度变迁问题。以我以前在国内所受 
的学术训练，基本是看不上定童研究的。一方面，我们倾向 
于研究大问题，不喜欢纠缠于细枝末节。国内一位老师的 
话给我的印象很深，大致是说 :如果 你看到一堵墙就要倒 
了，还用得着纠缠于那堵墙的倾斜角度究竟是几度吗？所 
以，很多研究都是大而化之，只要说得通即可。另一方面， 
国内(十年前)的统计教学，总的来说与社会研究中的实际 
问题是相脱节的。结果是，很多原先对定量研究感兴趣的 
学生在学完统计之后，依旧无从下手，逐渐失去了对定童研 
究的兴趣。 

我所就读的美国加州大学洛杉矶分校社会学系，在定量 
研究方面有着系统的博士训练课程。不论研究兴趣是定量 
还是定性的，所有的研究生第一年的头两个学期必须修两门 
中级统计课，最后一个学期的系列课程则是简单介绍线性回 
归以外的其他统计方法，是选修课。希望进一步学习定量研 



究方法的可以在第二年修读另外一个三学期的系列课程，其 
中头两门课叫“调査数据分析”，第三门叫“研究设计”。除此 
以外，还有如“定类数据分析”、“人口学方法与技术”、“事件 
史分析”、“多层线性模型”等专门课程供学生选修。该学校 
的统计系、心理系、教育系、经济系也有一批蜚声国际的学 
者，提供不同的、更加专业化的课程供学生选修。2001年完 
成博士学业之后，我又受安德鲁 • 梅隆基金会资助，在世界 
定量社会科学研究的重镇密歇根大学从事两年的博士后研 
究，其间旁听谢宇教授为博士生讲授的统计课程，并参与该 
校社会研究院 (Institute for Social Research) 定童社会研究方 
法项目的一些讨论会，受益良多。 

2003年，我赴港工作，在香港科技大学社会科学部，教授 
研究生的两门核心定量方法课程。香港科技大学社会科学 
部自创建以来，非常重视社会科学研究方法论的训练。我开 
设的第一门课“社会科学里的统计学” (Statistics for Social 
Science) 为所有研究型硕士生和博士生的必修课，而第二门 
课“社会科学中的定量分析”为博士生的必修课(事实上，大 
部分硕士生在修完第一门课后都会继续选修第二门课)。我 
在讲授这两门课的时候，根据社会科学研究生的数理基础比 
较薄弱的特点，尽量避免复杂的数学公式推导，而用具体的 
例子，结合语言和图形，帮助学生理解统计的基本概念和模 
型。课程的重点放在如何应用定量分析模型研究社会实际 
问题上，即社会研究者主要为定量统计方法的“消费者”而非 
“生产者”。作为“消费者”，学完这些课程后，我们一方面能 
够读慷、欣赏和评价别人在同行评议的刊物上发表的定量研 
究的文章;另一方面，也能在自己的研究中运用这些成熟的 




上述两门课的内容，尽管在线性回归模型的内容上有 
少量重复，但各有侧重。“社会科学里的统计学” (Statistics 
for Social Science) 从介绍最基本的社会研究方法论和统计 
学原理开始，到多元线性回归模型结束，内容涵盖了描述性 
统计的基本方法、统计推论的原理、假设检验、列联表分析、 
方差和协方差分析、简单线性回归模型、多元线性&归模 

以及线性回归模型的假设和模型诊断。“社会科学中 
的定量分析”则介绍在经典线性回归模型的假设不成立的 
情况下的一些模型和方法，将重点放在因变量为定类数据 
，包括两分类的 logistic 回归模型、多分类 lo¬ 
gistic 回归模型、定序 logistic 回归模型、条件 logistic 回归模 
型、多维列联表的对数线性和对数乘积模型、有关删节数据 
的模型、纵贯数据的分析模型，包括追踪研究和事件史的分 
这些模型在社会科学研究中有着更加广泛的 

修读过这些课程的香港科技大学的研究生，一直鼓励 
和亥持我将两门课的讲稿结集出版，并帮助我将原来的英 
文课程讲稿译成了中文。但是，由于种种原因，这两本书拖 
了四年多还没有完成。世界著名的出版社 SAGE 的“定量 
社会科学研究”丛书闻名遐迩，每本书都写得通俗易懂。中 
山大学马骏教授向格致出版社何元龙社长推荐了这套书， 
当格致出版社向我提出从这套丛书中精选一批翻译，以飨 
中文读者时，我非常支持这个想法，因为这从某种程度上弥 
补了我的教科书未能出版的遗憾。 

翻译是一件吃力不讨好的事。不但要有对中英文两种 



语言的精准把握能力，还要有对实质内容有较深的理解能 
力，而这套丛书涵盖的又恰恰是社会科学中技术性非常强 
的内容，只有语言能力是远远不能胜 任的。 在短短的一年 
时间里，我们组织了来自中国内地及港台地区的二十几位 
研究生参与了这项工程，他们目前大部分是香港科技大学 
的硕士和博士研究生，受过严格的社会科学统计方法的训 
练，也有来自美国等地对定量研究感兴趣的博士-究生。 
他们是： 

香港科技大学社会科学部博士研究生蒋勤、李骏、盛智 
明、叶华、张卓妮、郑冰岛，硕士研究生贺光烨、李兰、林毓玲、 
肖东亮、辛济云、於嘉、余珊珊,应用社会经济研究中心研究 
员李 俊秀; 香港大学教育学院博士研究生洪 岩璧; 北京大学 
社会学系博士研究生李丁、赵 亮员； 中国人民大学人口学系 
讲师巫锡炜;中国台湾“中央”研究院社会学所助理研究员林 
宗弘; 南京师范大学心理学系副教授 陈陈; 美国北卡罗来纳 
大学教堂山分校社会学系博士候选人姜念涛;美国加州大学 
洛杉矶分校社会学系博士研究生 宋峨。 

关于每一位译者的学术背景，书中相关部分都有简单 
的介绍。尽管每本书因本身内容和译者的行文风格有所差 
异，校对也未免挂一漏万，术语的标准译法方面还有很大的 
改进空间，但所有的参与者都做了最大的努力，在繁忙的学 
习和研究之余，在不到一年的时间内，完成了三十五本书、 
超过百万字的翻译任务。李骏、叶华、张卓妮、贺光烨、宋 
曦、於嘉、郑冰岛和林宗弘除了承担自己的翻译任务之外， 
还在初稿校对方面付出了大量的劳动。香港科技大学霍英 
东南沙研究院的工作人员曾东林，协助我通读了全稿，在此 



我也致以诚挚的谢意。有些作者，如香港科技大学黄善国 
教授、美国约翰 • 霍普金斯大学郝令昕教授，也参与了审校 
工作。 

我们希望本丛书的出版，能为建设国内社会科学定量研 
究的扎实学风作出一点贡献。 

吴晓刚 

于香港九龙清水湾 




社会科学数据分析者长期以来一直认为，中间变量的中 
介作用在理解个体的社会地位、行为模式及其他结果时处于 
首当其冲的重要地位。例如，在流行病学和健康研究中，探 
讨社会经济地位 （SES) ——经常用个体的教育获得来表 
示^~一对健康结果(不管是客观测量还是主观评估)的作用 
非常具有代表性。同样，社会人口学几十年的研究也已经表 
明，检验教育或其他 SES 变量对生育行为的中介效应是十分 
重要的。如果我们用X表示一个背景变量或决定因素， Y 表 
示一个结果变量， M 表示一个中间或中介变量，那么，对这三 
个变量的研究可以概括为两种类型的 作用： 

M-y 0 也就是说，背景变量对结果变量的影响既存在直接 
作用，也存在间接作用,而后者正是通过中介变量实现的。 

确实，以这种方式来思考因果关系的例子几乎存在于每 
一项应用统计方法的社会科学研究中。本书与此前许多著 
作相得益彰，包括 Long 所著的《协方差结构模型 
ance Structure Models ')、 Berry 所著的《非递归因果模型》 
(.Nonrecursive Causal M^40、Davi S 所著的《因果顺序的逻 



辑》 CT/wr Logic Or_rf«*) 以及在某种方式上与回归 

分析有关的那些著作。 


正如作者在第2章中所描述的，有三种基本方法可以分 
析中介作用。经典的中介作用检验创始于20世纪80年代， 
依赖的是经典的线性回归。有向非循环图方法是用路径和 
顶点来图形化地表示因果关系，并以此来实现模型化。最 
后，大家所知道的结构方程模型 (SEM) 方法为因果分析中的 
中介作用建模提供了最大的灵活性。这就是作者^本书中 
所采用的写作方式，这样的方式使研究者可以在出现多重测 
量时，处理中介作用、中介性的调节作用、调节性的中介作用 
以及中介作用这一主題下的其他议题。执行 SEM 软件的广 
泛可得性为读者提供了必要的工具来进行中介作用建模，以 
获得关于因果关系的正确理解。 


廖福挺 
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中介作用分析是用来考察某项数据是否具有中介结构 
的一套统计方法。中介结构这一概念指向这样一种特定形 
式的因果关系机制——某个自变量对某个因变量的影响可 
能并非是直接的，而是通过某种中介过程实现的，或者说，某 
个自变量是通过某个中介变童而间接影响某个因变量的。 
试图检验中介关系的研究者通常将这些变量之间的相互关 
系称为“因果关系”，例如，自变量影响了中介变量(或自变童 
的变化导致了中介变童的变化），而中介变童又影响了因变 
量。研究者随后会用一套统计方法来检验这些变量在经验 
数据中的相互关系。在本书中，我们将同时从概念和统计两 
个方面来讨论中介关系的检验方法。 

在本章，我们将首先回顾确立和证实因果关系的逻辑以 
及(在社会学这一学科内人们所认同的)方法。不管使用哪 
种具体的统计工具来检验中介模型，这些概念层次的讨论都 
是切题的。 

在中介关系研究文献中，一些学者已经重新强调了要注 
意对数据结构中的相关关系所作出的因果关系解释(例如， 
Holland， 1986； James &- Brett, 1984； James，Mulaik &- 
Brett, 1982； McDonald, 2002) ，其中更有一些人认为，实验 




方法仍然 是最麵 的确立因果关系的研究设计(例如， Shrout 
Bolger, 2002； Spencer, Zanna &- Fong, 2005)。 一些研究者已经 


尝试对基本的中介统计方法进行改进或提升(例如， Kenny， 
Kashy &- Bolger, 1998； MacKinnon, Lockwood, Hoffman, 
West &• Sheets, 2002； MacKinnon, Warsi &• Dwyer, 1995), 


还有一些研究者已经同时讨论了因果逻辑层次的议题和经 


验层次的方法改进问题(例如， Bender, 2001, Cote, 2^01, 
Lehmann, 2001； McDonald* 2001； Netemeyer, 2001)。 我 


第 1 节 I 中介作用是什么以及 
它为什么重要？ 


许多社会科学研究者都对中介作用感兴趣 （Baron &• 
Kenny, 1986; Iacobucci， 2001» James &• Brett, 1984j 
MacKinnon et al. , 2002)。 中介作用背后的理论假设是，中 
介变量反映了自变童通过它来影响因变量的过程。研究者 
试图评估自变量对因变量的直接作用或(通过中介变量产生 
的)间接作用有多大。 



图 1.1 简单的、标准的三变置中介棋型 


如图 1.1 所示,X是自变量， M 是假定的中介变量， Y 是 
因变量。传统上来说，研究者是要考察预测变量(例如X)与 
因变量(例如 Y) 之间的关系。但在假定和检验中介作用的 
研究中，研究问题则变成了 X对 Y 的作用是直接的（即 X- 
Y) 还是间接的(通过 M 起作用，即间接作用情 
况下的假设是，变量X有助于预测和解释中介变量 Af 的变 
化，而这又有助于预测和解释变量 Y 的变化。 

探寻中介作用的目的是理解X影响 Y 的具体过程。在 



发现了某些经验现象 (P X 看似影响 Y) 之后，通过理解这一 
经验发现的本质(即X如何影响V)，才能实现理论的发展和 
提升。这种解释或许很 简单: x 本身确实部分地解释了 y 的 
变化。但或许还存在另外一种替代性的 解释: x 之所以能部 
分地解释 y 的变化，只不过是因为 x 和 y 都与某个中介变 
量 m 相关。 

研究者似乎发现，中介作用逻辑从直观上来看，根当具 
有吸引力。反映中介作用重要性的一个度量是有关中介作 


上述主題各异 P 研究都关注中介作用，这支持了前文的 
观点,即中介作用相当重要，因为对它的研究很流行。姑且 
不论研究的内容和理论立足点是什么，对研究者来说，检验 
中介作用之所以具有吸引力，原因在于它试图追踪 x 影响 y 
的具体过程。 

我们在后文即将讨论检验中介作用是否存在的有关方 
法论问题，例如，中介作用分析在当前的研究文献 f 是如何 
进行的？这些分析如何做得更好？在棘手情况下如何处理？ 
但是，让我们先来回顾一下涉及因果关系推论的几个概念性 
的问题。 




第 2 节 I 因果关系 


本节我们将回顾表明因果关系确实存在的几个必要条 
件。这样做的原因在于 * 检验中介作用的研究者经常用因果 
关系的语句来表达他们的发现•例 如说: 通过 m 影响 y。” 
或者有时更明确 地说， X影响 M， 而 M 又影响 y。” 在解释如 
图 1. 1那样的路径模型时•对从 x 到 m 到 y 的因果关系链 


不加任何说明或推论，几乎已经成为了一种不可抗拒的习 


惯。在本节的讨论中，我们将承认依据中介分析方法来确立 
因果关系所面临的挑战。正如下文所述，这涉及两个问题， 


首先，用来检验和分析中介作用的数据通常只是相关性的， 
而用它来得出有关因果关系的清晰结论在数据上具有局限 
性。确实，许多社会科学家都认为，实验方法中对变化机制 
的操控以及测量方法的使用仍然是最好的，并且，或许只有 
实验方法才能真正洞察因果关系。其次，任何一种统计方法 
本身都无法从相关性数据中“提取”它所潜藏的因果关系含 
义。然而，表明因果关系仍然是许多检验中介作用过程的研 
究者的目标，因此，一些指导性的原则对于理解各种情形下 
因果关系何以成立以及提高因果关系成立的可能性来说相 
当重要。 

在试图用证据来确立因果关系时，科学哲学家都趋于接 



受 Hume 和 Mills 所提出的必要性准则： （1) 共 变性; （2) 次序 
性; （3) 排除竞争性的解释。我们将对此分别进行讨论。 

共变性 

共变性准则是指，如果 x 是 y 的原因，则 x 与 y 必然相 
关。众所周知，社会科学家的研究对象一^人类的行为方 
式，十分微妙和复杂，因此，即使满足这第一个要求也是有困 
难的。 

这牵涉到几个问题。首先，可能存在多种原因，也就是 
说, x 可能只是 y 的几个原因中的一个(例如，家庭收人虽然 
对汽车消费有影响，但它并不是汽车消费的唯一决定因素）。 
在十分复杂的情况下， x 与 y 之间的相关性可能会很低，因 
为还有其他因素可以解释 Y。 

第二，即使关于 x 与 y 之间关系的理论假设在研究总体 
中确实成立，众所周知，用抽样以及特定的测量方法或变童 
来对 x 和 y 进行操作化时，也都会不可避免地造成随机误 
差。由于误差的存在，在经验数据中所观察到的表示 x 和 Y 
的变量之间的关系会被减弱或冲淡。 

第三，如果两个变量之间的相关性出于上述原因或其 
他任何原因而被削弱，由于中介作用分析所关心的间接作 
用是两个概率函数——分别涉及^与—的联合作用 
结果，那么在经验数据中发现可以用来支持间接作用路径 
的结果的可能性就会变小，相应地，失败的可能性就会增 
大。也就是说，如果全部的作用路径在估计时都存在误差， 
那么唯一的那个直接作用路径会显得更为突出，因为间接 



因果关系，那么就应该存在相关关系。即便是学习基本统计 
的学生都知道，与这句话相反的表述并不一定正确，也就是 
说，相关关系并不一定意味着因果关系。换言之， x 与 y 之 
间的相关可能是因为 x-y， 也可能是因为 y - x , 还可能是 
因为有第三个变量同时影响了 x 和 Y。 因此，相关性的存在 
并不能使我们对这些情况中的任何一种作出定论。这种提 
醒并非多余之举，因为使用相关性数据来论证因果关系的情 
况在研究者分析中介作用的发表论文中（甚至在顶级期刊 
中)相当普遍。 Baumri n d(1983) 在关于相关性数据不能作为 
因果关系结论的依据这一点上，立场十分 鲜明: “我们应该打 
消统计方法能够证明从相关性数据中可以得出因果关系推 
论的正当性的念头。 ”（1983 : 1289>Breckle r (1990) 有类似的 
言论 :“相 关性数据的确不能为因果关系推论提供充足的依 
据。 ”（1990:269) 

实验方法在微观社会科学(与社会学或宏观经济学相 
对，例如，消费行为学、心理学)中甚为流行，它被普遍认为是 
识别因果关系的最精确的方法设计 (Mill 主张用实验方法来 
确立关键因素之间的因果关系，并要在实验设计中保证观察 
个体的随机分组;另见 Holland, 1988, Rubin, 1974、2005)。 
“传统实验方法的目标是要保证实验者能够清楚地推论因果 
关系是否存在以及它的作用方向。” (Baumrind, 1983:1290) 
既然实验方法能够更好地确立因果关系， Spencer 等人 


(2005) 就提出，对因果关系链 (X-M-y) 的检验应该 通过一 
系列实验方法进行。具体来说，在一个实验设计中，研究者 
通过操控自变童X的变化来测量它对 M 的 影响; 在另外一 
个实验设计中，则通过操控 M 的变化来测量它对 Y 的 

影响。 [1] 

中介作用分析有时确实会在实验环境中 进行: 先做一个 
实验，再通过方差分析 (ANOVA) 来看因变量的变体。即使 
研究者只用一个简单的 2X2 实验设计，并用 ANOVA 来分 
析所得结果，对某一因果关系假设的检验就已经达到了实验 
方法所能够达到的效果。 [2] 如果这一简单的 2X2 实验设计 
已经达到了目的，就确立因果关系而言，实验者应该就此停 
止，因为它已经达到了作为一种检验方法所需的严谨性。加 
人中介作用分析并不会使分析方法的严谨性更高，也不能证 
明研究者有多大的信心可以就因果关系下结论。但实际情 
况是，有时候研究者会在对关键因变童进行 ANOVA 分析 
后，再将一些补充性的测量加人中介作用分析。可以想象， 
研究者相信通过引人其他的统计检验(即与中介作用分析有 
关的一些统计指标)可以增加其分析的价值或严谨性，但事 
实并非如此，至少就确立因果关系而言，并非如此。当研究 
者加人中介作用分析时，他们其实是在分析相关性数据，而 
这种数据在识别因果关系时，却并不具备任何优越性。因 
此，在报告对核心因变量所进行的 AVONA 分析结果之后再 
加入中介作用分析，对一篇论文来说其实是减分而不是加 
分。所以，中介作用分析不应该是研究者的一个下意识的 
动作。 

有了实验数据，研究者就有了较强的逻辑基础来论证 




PM-Y 这一因果关系（例如， Netemeyer， 2001)。对这种 
具有高度内部效度的研究来说，除了研究者刻意操控的因素 
之外，所有其他的条件都不变，这样一来，因变量的变化就可 
以被纯粹地归因于实验干预项的作用。然而，如果是对横截 
面数据或相关性数据进行中介作用分析，研究者的措辞就必 
须有所保留，或许可以说是“结构性的关系”，但不能说是“因 
果性的关系”。 

次序性 


次序性的准则是指，如果 x 是 y 的原因，则 x —定是在 


y 之前发生的。要满足这一条件似乎很简单。在理想状态 
下，研究者应该按变量在理论所预示的过程或机制中出现的 
顺序来依次测量:首先是X，其次是 m ， 最后是 y。 这里所说 
的依次测量不是简单地指它们出现在同一个调査问卷中的 
不同页面上，而是指它们出现在三次数据收集进行时所处的 
三个时间点上 U 、&、《,)。这种测量顺序的存在使考察因果 
链或时间链的动态过程成为可能。 [3] 在时间点^测量的变量 
有可能影响在时间点^测量的变量，但在时间点^测量的变 
量却绝不可能影响在时间点^测量的变量(实验方法也是依 
时间维度进行的，对某个变量或条件的操控发生在时间点 
u ，对因变量的测量发生在时间点 ，即使两个时间点之间的 
间隔时间很短）。 

次序性是可以实现的，最理想的办法就是让受访者在时 
间点~回答有关X的调査题目，在时间点6回答有关 M 的 
调査题目，在时间点回答有关 Y 的调査题目（各次测量之 


间的间隔时间要具有一定的意义）。然而，出于实际操作的 
原因(后勤管理、参与者的流失等等），这一理想状态很少能 
够实现。其实，许多中介作用检验都应用了依据横截面调査 
设计所测量得到的相关性数据(即数据是在一个时间点上收 
集得到的）。而且，在大部分已经发表的包含中介作用分析 
的论文中, x、M 和 y 的测量都是在同一次调査中完成或是 
同时进行，或是颠倒次序的(例如，通常情况下是先测量 y 再 
测量目的是保证因变量的测量不被其他测 k 所干扰）。 
当全部测量题目或量表出现在同一次调査中时，研究者就需 
要从逻辑上或理论上来论证先后次序关系。 

在一些情况下一假如先后次序不是很关键——这种 
论证或许站得住脚。例如，如果X是一个稳定的人口学或特 
征变量，就可以在调査结束时才对它进行测量，这样做不会 
产生弄错因果作用的顾虑。也就是说，在这种情况下，态度 
测量 (M) 或行为测量 (Y) 不会对一个早已存在的状态测童 
Q0 产生影响。 W 然而，当X、 M 和 y 测量的都是态度，并且 
不按先后次序进行时，就会增加在概念上论证作用关系的难 
度。相反，仅仅满足次序性要求也是不够的。也就是说，在 
时间点 A 测量X，在时间点&测量 M， 在时间点 A 测量1%仍 
然无法保证 x-M-y 这一因果或时间顺序一定成立。例 
如，如果X表示态度,从表示行为倾向， Y 表示个体特质或人 
口学特征，显然不能将因果顺序总结为因为在逻 
辑上, Y 几乎肯定是先于X或 M 而存在的。即使再复杂的 
统计工具,也无法克服逻辑上的问题。 

再者，许多双向关系的存在也可能导致难以确定因果关 
系或时间顺序的方向。即使绝大部分的变化是沿 x-y 这 



什么理论贡献。这种形式的论证也不能表明中介作用的存 
在，因为它是由概念化过程本身所决定的。 [5] 


排除其他可能的解释 


如果已经存在众多的竞争性解释，那么其中的任何一 
种都会威胁因果关系结论的内部效度，也就是说，会威胁研 
究者在将观察到的数据模式归因于有待检验的理论观点时 
的确定性。例如，如果市场营销人员试图将近期的销售增 
长归因于前期的促销活动，就必须排除另一个可能的原因， 
即销售的自然性或季节性增长 （Churchill & Iacobucd, 
2005)。在此我们再一次说明，精心设计的实验方法被认为 




一个问题 :“我 们能否弄清楚，是不是电线短路导致了火灾?” 
(参见 Suppes, 1970)。就 INUS 条件的后半部分 f 非必要但 
充分”)来说，可能导致火灾的条件有好几种，因此，电线短路 
本身是一个非必要(一根火柴也可能导致火灾)但却充分的 
(电线短路当然能够导致火灾）因素。就 INUS 条件的前半 
部分(“不充分但必要”)来说，仅仅发生电线短路是一个不充 
分但必要的因素——即其他因素也必须具备，例如，发生电 
线短路的地方附近存放着可燃物质。 INUS 条件就是试图将 
这些情况都考虑进来以排除竞争性的解释。 

这种逻辑上和经验上的因果关系检验有时候会面临更 
大的挑战，例如，当碰到像这种延展性的关 
系链时，或者当碰到像 X-M.-Y 并且 X^M 2 -*Y 这种多元 
中介作用路径时 （Karson Fisher， 2005, Salmon, 1997>- 8 
这里需要再次说明，由于存在前文所说的测量误差和抽样误 



中介关系、相关关系与因果关系 


诚然，在确立因果关系时所面临的上述问题并不是什么 
新鲜事。但借助下面的方法，或许可以使这些早已明确的问 
题显得更为清楚，即阐明三个关键概念或变量(X、 M、Y) 之 
间的相关矩阵如何产生好几个可以相互替代的竞争性型， 
但却同时得出与图 1. 1所示的中介作用结构相一致的结果 
(参见 Breckler， 1990； Lee &- Hershberger, 1990? MacCal- 
lum» Wegener, Uchino &• Fabrigar, 1993) 0 我们稍后会详 
细讨 4 模型识别与模型等价性的问题(例如，在什么情况下， 


果是等价的）。由于数据在本质上只是概率性的， rxy.M 的数 
值或许不一定等于0,所以我们可以换一种说法，即期望 
r w . M 不显著，也就是说，其数值与0之间的差异不具有统计 
显著性。如果数据同时支持直接和间接作用路径，那么偏相 
关 . x 的数值虽然会比较小，但应该不会为0，或者应该不 
会不具有统计显著性 (Asher， 1983:21)。 

我们会在本书随后的章节中继续讨论竞争性解释和模 
型的问题。但最后再提一下，根据我们对学术期刊论文的观 
察，很少有作者会提到竞争性理论的问題，更别说检验它了。 
包含中介作用分析的论文在前言部分也很少提到研究的内 
容之一是要检验 x 影响 y 的可能方式，也很少明确说明将会 
进行中介作用检验(虽然这样说或许有些吹毛求疵了）。诚 
然，作为一本书的介绍性章节，或许不必预先提及书中将会 
涉及的这些问题，但是，既然本书旨在分析中介作用，统计检 
验就必然要涉及，不管是从理论还是从分析的角度来说，都 
应该予以考量。这种事后考虑提出了一个概念上的存疑，即 
中介作用的检验究竟是否必要？当然这也提出了对概率性 
统计检验指标的关注。 





本章将介绍检验中介作用及其经验证据的方法。我们 
将首先回顾传统的检验中介作用的方法，即在回归分析的基 
础上使用 Baron 和 Kenny(1986) 以及 Sobel(1982) 的 z 检验。 
根据这些方法所设定的准则，研究者可以声称中介作用在他 
们所使用的数据中是“完全的”、“部分的”或是“不存在的”。 
我们将讨论如何正确地运用这些技术和方法、如何避免易犯 
的错误以及文献中存在的争议。 

随后，我们将介绍另一种方法的可行性，即用有向非循 
环图来检验中介作用结构。虽然这种方法有助于概念层面 
的理解，但从经验层面来讲，第三种检验中介作用及其众多 
扩展形式的方法——结构方程模型 （SEM) ——将会被证明 
更具优势。因此，在简要回顾了回归方法和图示方法之后， 
本书的其他部分都在 SEM 的基础上进行分析。 



第 1 节 I 经典的中介作用检验 


最流行的检验中介作用的方法是由 Baron 和 


(1986) 提出的。根据这一方法，研究者需拟合三1 


M = ^ + aX + £i 
y = A+cX+e 2 
y = A+d + ttVf + e 3 
方程中的 0 表示截距(一般忽略不计)， e 表示模型的误差项 
(—般也忽略）， a、 6、 c、 〆表示回归系数，反映了三个关键变 
董之间的关系。如果满足下列条件，则认为中介作用可能存 
在:（1)方程 2.1 中的 a 显著，也就是说，有证据表明自变量 
O0 与中介变量 (M) 之间存在线性关系； （2) 方程 2. 2中的回 
归系数 c 显著，也就是说，自变量(X)与因变量 (Y) 之间存在 
线性 关系; [6] (3) 方程 2. 3中的6显著，意味着中介变量 (M) 
有助于预测因变量 (y)， 并且，显示自变量 (x) 对因变量 (y) 
的直接作用的与方程 2. 2中的(:相比，数值显著变小 
方程 2. 2中的 c 与方程 2. 3中的〆的数值大小的比较是通过 
z 检验来判定的 （Sobel，1982)/] 可以证明，检验 c( 直接作 
用)与 /( 控制了间接的中介作用之后的直接作用）的差异与 


检验中介作用路径 （fl X 6) 的强度是否大于0是等 价的： 


方程中 a 和的值可从方程 2. 1中得到,6和4的值可从方 
程 2. 3中得到。％ 

请注意，计算时可使用回归系数，也可使用标准化回归 
系数，只要它们各自的标准误可得。因为有 K 灸）= 
(s x A y )SE：(6 x ) 和犯(和）= ( s m /5 v )SE：(6 m ) 或者 SE(6 X ) = 
U/ 办)亚(你）和 SE(M = (sy/s^SEC^),, 

如果 a 或者 6 不显著(或者两者都不显著），就不存在中 
介作用，研究者可以总结说X对 Y 的影响都是直接的，而不 
是通过 M 这一中介实现的，那么分析就到此结束。如果满足 
上述三个条件，研究者就可以总结说至少存在“部分的”中介 
作用，即X对 Y 的影响部分是直接的，部分是间接通过 M 这 
一中介实现的。如果上述三个条件都得到满足，但〆不显 
著，就可以总结说存在一种“完美的”或“完全的’’中介作用， 
即X对 y 的影响全部是通过 M 这一中介间接实现的。％ 

研究论文经常较少报告其分析细节，这种策略确实会 
“保护”研究者较少受到质疑，撇开这一点不谈，我们还是会 
发现，许多关于中介作用的分析其实并不正确。例如，虽然 
大多数论文的分析都严格遵循了上述三个步骤，但并非所有 
的论文都是如此。而且，许多研究都并没有报告 z 检验的结 
果 Jiol 在那些严格履行了所有检验并且完整报告其结果的 
论文中，大多数结论都是存在“部分的”中介作用。尽管这一 
基本结论看似合理，即X对 Y 的影响部分是直接的，部分是 
间接的(通过 M 实现的），但它也只不过是一个不怎么令人激 




动的结果而已。 

Baron 和 Kenny(1986) 的论文在引导研究者思考中介作 
用以及为研究者提供一套方法来发现数据中的中介作用这 
两个方面影响很大。 [11] 他们所提出的技术和方法不仅吸引 
研究者将其应用于各自的研究领域和理论问题，而且催生了 
方法本身的研究，即促使研究者考察关于中介作用的经验性 
检验方法的一系列问题。 [12] 例如， MacKinnon 和他的同事进 
行了一些方法上的检验，以此比较不同的统计量在发现甲介 
作用模式上的相对优劣以及不同的指标在反映数据中存在 
中介作用结构强度上的相对功效 (MacKinnon et aL , 1995、 
2002) 。[ 13 ] 


第 2 节 I 另一种 方法： 有向非循环图 


关于如何检验和考察因果关系的文献很多，这是科学哲 
学、统计学和机器学习等学科交叉发展的结果(参见 Hayduk 
et aL * 2003» McKim &- Turner, 1997; Pearl, 2000； Salm¬ 
on, 1997)。 学者重新思考因果概念的逻辑以及检验和测定 
经验关系的方法（例如， Shafer， 1996; Spirtes, Glymour 
Scheines, 2001)。 考虑到对复杂性的重新认识，一些学者提 
到了确立因果关系的“艺术性”（参见 McDonald， 2002; 
Pearl, 2000) ，其中许多人所使用的工具之一就是“有向非循 
环图”，或简写为 DAG， 它与中介作用问題有着十分密切 
的联系。 

“有向非循环图”方法中的术语是这样定义 的:该 图由表 
示关系的连线(例如，因果关系或相关关系）和节点(例如，变 
量和组成。当图中的连线从一个节点(例如，X)出 
发并指向另一个节点(例如， y) 时，就成了“有向图”。如果图 
中的连线不是循环的(对每一个中介作用路径而言)或者一 
个因果关系链的终端变量不会反向作用于它的起始变量， 
“有向图”就成为了“有向非循环图”。也就是说，在“有向非 
循环图”中，一个表示关系的连线不可能再绕一圈返回到它 
的起始节点上(循环图则相反，例如， X — 或者 



X 一 M—y—M)。 


如果 X 与 y 之间的关系全部是中介性的，那么 DAG 分 
析可以总结说，控制了 M 之后,X与 y 是相互独立的。 DAG 
的标注方法会显示，给定 Y 和 Af 之后，X的概率会等于给定 
M 之后X的条件概率。具体的标注方法如 下:若 P(X 丨1% 
M) = P(X 丨 M) ,则X丄 Y I M。 在经验研究中，这些概率可 
以通过计算偏相关系数来估计。如果这一偏相关系数 
不显著(即系数值与0之间的差异不具有统计显著性） ，那么 
(x 与 y 之间的）相互独立关系就能成立。可以推测，如果 
P(X|y, M)^P(X|M), 那么存在中介作用的强度就会减 
弱(“部分的中介作用”或“不存在中介作用”,但无法区分究 
竟是哪一种情况)。 

DAG 其实对应于某一特定的理论模型，也就是说， X— 
M-y 这一中介作用模式肯定构成了一个有向非循环图。然 
而, McKim 和 Tumer(1997) 指出 ,DAG 并没有回答如何从相 
关性数据(例如，只能观察到是否相关)推导出因果关系这一 
问題; Humphreys 和 F r eedman( 1996) 认为, DAG 并没有揭示 
因果关系结构，却假定了因果关系的存在。 

另外, DAG 对于用经验数据分析中介作用来说并不是 
那么有用，其实，坦白地讲，这一方法本来也不是特定服务于 
这一目的的。例如，有人设计了 DAG 软件，但其目的只是发 
现和展示数据中的 DAGCHaughton, Kamis &- Scholten, 
2006, Shipley, 2000)。 在包括许多节点和作用关系的复杂 
网络中，査找 DAG 会比较有用，因为这些关系网中的作用模 
式很难一眼辨别，而 DAG 标识出了递归模式的关系链，并将 
其与循环作用模式进行了区分。然而，这一工作与中介作用 


分析并没有什么关系，因为在后一种情况下，我们其实知 
道哪里会有 DAG (而且，中介作用分析中的节点通常很少，一 
般来说只有三个）。确实，某些 DAG 分析技术（例如， 
“D^eparation” 关注模型中几个特定的作用路径)类似于估计 
偏相关，但它们与结构方程模型相比，并不具备方法上的优 
势 (Hayduk et aL , 2003)。例如， Pearl(2001) 讨论了如何将 
X — M—y 这一关系链分解为直接作用和间接作用,但结构 
方程模型也可以做到这一点。通用的计算软件包都没有专 
门针对基本中介作用模型的拓展情况作程序设计，也没有反 
映拟合性的统计指标。因此， DAG 并没有为具有中介作用 
结构的数据提供一个最佳的分析方法。 




中介作用研究文献在方法上最大的发展就是学者逐渐 
用 SEM 来检验中介作用模式。回归方法操作起来当然容 
易, Baron 和 KennyC 1986) 的论文对此巳经讲得很淸楚，但研 
究者经常会遇到更加复杂的情形，需要进一步的指导。另 
外, SEM 本身发展到现在已被普遍使用，该工具对检验数据 
中是否存在中介作用模式显得尤为适合。 

例如，试想一下这种情形，即研究者分别用多个指标来 
测量X、 M 和/或 Y 这三个概念建构 （Baron 和 Kenny 1986 
年的论文也提到过这种情形，但没有全面地加以讨论）。这 
时， SEM 就可以同时提供一个测量模型和一个结构模型，并 
将两者完美地结合在一起 : 首先, SEM 提髙了概念测量的可 
靠性;其次, SEM 检验了这些概念之间可能存在的中介作用 
关系。 

我们还可以试想一下另外一种情形，即 m 和 y 这三 
个概念嵌套于一个更大的分析网中，它囊括了一些其他原因 
变量和结果变量。在涉及其他概念或变量时，要检验最为关 
心的 x-jvf-y 这一中介作用，典型的回归方法在某种程度 
上有些无从下手。例如，当 (X、M 和 Y 之外的)其他概念或 





变量作为解释因素时，它们应该被纳入方程 2.1 至方程 2. 3 
中的哪个或哪些方程？它们什么时候又应该被作为因变量 
来处理？应该比较哪些参数？ 

一种特殊的扩展性分析网会在研究者检验多元中介作 
用路径时，或者当因果关系链拉长时出现，前一种情况下的 
例子如 x-M, -y 和一 y， 后一种情况下的例子如 
X-M, —H —y。 如何用回归方法的拓展形式来回答这些 


问题并不明确，但 SEM 的拓展方法却相当简单和直接，正如 
我们即将演示的那样。 

因此，本书将阐明用 SEM 来检验中介作用的方法，首先 
介绍最简单的中介作用结构，其次加入一个测量模型，随后 
再加入更复杂的结构模型。我们也将使用这些技术和方法 
来重新探讨其他议题，包括如何检验调节性的中介作用等。 



用结构方程模型来分析 
中介 作用： 测量模型 





SEM 是一个强有力的统计方法，代表了目前最先进的 
技术发展水平，它使得研究者可以在一系列更广泛的情境中 
研究中介关系。结构方程模型整合了测量模型和结构模型。 
我们在本章考察的是结构方程模型的测量部分。我们将考 
虑中介模型的扩展形式，以纳入任一概念建构所具有的多重 
指标。在下一章中，我们考察的是结构方程模型的结构部 
分。届时我们才会检视实质性的模型延展，即同时考虑不限 
于 x、 m 和 y 的更多的概念建构。 



第 1 节 I 多重测量情况下的中介作用 


用于中介分析的社会科学数据通常都是由受访者报告 
的，因此，报告过程中所产生的测童误差将会减弱或冲淡对 
统计关系的估计。 Banm 和 Kenny(1986 : 1177) 承认,他们的 
( 中介分析)基本方法与任何回归分析一样，无法对测量误差 
作出某种特别的考虑，而只能简单地将其放入总误差项中， 


从而导致模型拟合上的欠缺，即1 一把。虽然将单一变量作 
为某一概念建构的唯一指标在统计上确实是妥当的，但大多 
数社会科学家却认为用多项量表更可取，这与古典检验理论 
在哲学认识上是一致的,与越多的测量项目构成了越强的测 
量工具这一关于信度的理念也是一致的。 [14] 1986年的回归 
方法仅仅适用于三个变量所构成的系统，也就是说，三个概 
念建构中的每一个都是由一个指标来测量。然而，图 3.1 却 
显示了另一种典型的研究情境，即每一个关键的概念建构都 



由多项量表来测量。这只是一个示例，对于我们将要描述的 
分析技术来说，测量X、 m 和 y 的指标数目可能是两个，也 
可能是两个以上。 

或许最容易想象的情形是存在多个预测变量兄、X、 
x 3 ，一 个中介变量 M 和一个因变量 Y。 在回归方法中，通过 
变量替换，方程 2. 1至方程 2. 3会 变为： 

M = +a 2 X 2 +a 3 X 3 +e. [3. 1] 

y = A+Ci>X\+c 2 X 2 +e?, [3.2] 

y = 译 + fU, + c 2 X 2 + c 3 X 3 +6M + e fi [3. 3] 

然而，即使是在这种简单的扩展形式中，有两项任务已 
经变得十分复杂 :首先 ，为了评估中介作用的程度，应该比较 
哪些回归系数并不清楚;其次，X,、 x 2 、兄的作用会因它们 
之间的多重共性线而发生衰减，这是当预测变量代表了同一 
个概念建构的多重指标时所固有的问题。 

若中介变童 M 或因变量 Y 也应该被一个以上的指标进 
行测量，情况会变得更复杂。首先，可以看到的是，新的复杂 
性可能简单地与 x 的复杂性类似。然而，由于 m 和 y 都在 
中介作用的一系列回归中充当了因变量的角色，因此， M 和 
y 数量的增加会要求产生更多的预测方程。例如，在三个中 
介变量和两个因变量的情况下，应有如下 方程： 

Mj = Pj -\-a t Xx -\-a 2 X 2 +a 3 X 3 +€ 7 [3；. 4^i 

M 2 +a,X, +a 2 X 2 +a 3 X 3 +e 8 [3. 5] 





第 3 章用结构方程横型来分析中介作 用:涮 量樓型 | 

y 2 =A» +C 2 X 2 +C3X3 +e u [3.8] 

Y\ = c\ X x 4 - czXt + ciX 3 H-filVf] +e« [3:. 9] 

Y, =^, -f-ciXa +c 2 X 2 +C3X s +«Vf 2 +c 13 [3.10] 
Vi= A«+^Ui + C ' 2 X 2 + C ' 3 X 3 +6M 3 +€h [3.11] 
y z =As +CIX, +c' 2 X 2 + C ’ 3 X 3 +AM, +e» [3.12] 
Yz =pi, -\-c\X, +c 2 X 2 + c f 3 X 3 +bM 2 4-e 16 [3713] 
Y z = A7 +c ； X, +c , 2 X 2 +c , ,X s + 6M3 +e 17 [3.14] 
即使是适度地扩展到三个概念建构都具有若干个测量 
变量这种情况，方程的数量和检验组合的数量都大大增加。 
这时进行中介分析有两种选择。首先，大多数研究者会计算 
所有量表—— X^x 2 .x 3 —中各项的均值，得到又，如此 
类推。用这些汇总数值来代表各个概念建构，就会使原本复 
杂的测童情形得以简化，因此模型就十分类似方程 2. 1至方 
程 2.3 ，即： 

M =译 8 + aX + ew [3.15] 

Y = ^ 9 +cX-|-e 19 [3.16] 

歹= Ao + c'X + + e20 [3.17] 

因此，一个多变量问题就被有效地简化成了一个只具有 
单一预测变童的问题。我们接下来会说明，这种解决方案虽 
然可以接受，但却并不是最理想的。 









第 2 节 I 中介作用与结构方程模型的 
测量模型 


第二种选择是使用结构方程模型。结构方程模型正是 
被设计出来以解决方程 3. 4至方程 3. 14这样的线性方程系 
统。 SEM 在社会科学中已经司空见惯并有可供运行的软件， 
其逻辑也已经被广泛地理解 (Kline, 1998), SEM 为检验概 
念建构之间的中介关系提供了目前最先进的分析方法，尤其 
是当多重题项或多重变量被测量以用来捕捉关键概念建构 
的时候。 [ ls] Br 0 wn(1997) 和 Long(2006) 的著述在这方面是 
极好的人门读物。 

如果X、 M 或 Y 中有一个或几个是通过多项量表来 
进行测量的，则这种情形下的基本的中介作用探索就可以 
用表 3.1 中的描述来总结。该表呈现了单一测量与多重 
测量的所有组合形式，并标明了在哪些情形下可以使用回 
归方法。具体来说，只有当X、 M 和 y 这三个概念建构都 
由单一分值来表示时，就可以用回归方法，这里所指的单 
一分值，既可以是单一变量（例如, M), 也可以是用来测量 
某一概念建构的多重题项的得分均值（例如， {M, M 2 , 
M 3 }—M ) 0 




表 3.1 


中介变童 ( M ) 

的测量数目 • I 


M z ,M 3 


M 



(例如, M ). 

然而，更为一般化的结论是， SEM 可以在任意一种情形 
下使用，这也是唯一一项适用于大多数研究情境的分析技 
术。即使是在最简单的数据情形下（回归在此种情形下看似 
可作为一种替代性的方法），我们也会表明，就算回归方法与 
SEM 之间存在某种一致性， SEM 技术无论在理论层面还是 
经验统计层面都是一种更具优越性的方法。 

总而言之，上表说明，结构方程模型总是适用的，而只要 
任何一个概念建构是由多重题项来测量的(并非用一个均值 
来反映），就不能使用回归方法。因此，对于分析中介结构来 
说，在表 3. 1中的任何情形下， SEM 都提供了一个自然的选 
择和一项最适合的技术。 







第 3 节 I 实例阐释 


我们刚才已经论证了 SEM 方法在统计上和瑾论上都优 
于回归方法。在本节中，我们用几个说明性的数据和分析来 
展示 SEM 的这种优越性。首先，让我们来比较结构方程模 
型和回归方法在最简单的数据情形下的表现，即只有一个X 
变量、一个 M 变置和一个 Y 变童来分别代表三个概念建构。 
在这种(也只有在这种〉最简单的情形下，我们将看到 SEM 
和回归方法这两种分析技术会得到一些相似的结果，但我们 
也将发现它们之间的不同。 

从相关系数推导出路径系数的方程如下 (Asher， 1983, 
James et al * 1982) : 

[ 3 . 18 ] 

c= (i —^ ) ^ r xr — rxwrjw ) 

与之对应，从路径系数推导出相关系数的方程如下 * 


r w = b~\~ac 


：3.19] 



例如，一位研究者得到这样一个相关 矩阵： = 0.55, 
rxr = 0.45, ^ = 0.63 0 根据这些相关系数，我们可以用方 
程 3. 18来估计路径系数 a、 6、 d 它们分别代表了 
M—y、X—Y), 由此得到 a = 0. 55, 6 = 0. 55, C = 0. 15。这 
些路径系数表明，由X所解释的 Y 的变异中，有2/3是通过 


中介变量 M 间接实现的 ，即： 

aX b 0.55X0.55 

Ca X b)-h c ~ <0-55X0.55)+0.15 


= 66.9% 


在这种最简单的数据情形下，即只有三个概念建构并且 
每一个概念建构都只由一个测置来表示，无论用回归方法还 
是用 SEM 来计算，所估计的路径系数都是相等的。两种分 
析技术都是以方程 3. 18为基础来对参数作出估计的。 

但是，两种分析技术也存在一个重要的系统性差别。回归 
方法中的系数标准误要比 SEM 中的大一些。对一个不算大的 
样本《 = 50来说，用回归方法得到的标准 误是： SE(a) = 
0. 121， SE(6) =* 0. 134, SE(c) = 0.134; 用 SEM 得到的标 
准 误是： SE(a) = 0. 119, SECb) = 0. 131, SE(c) = 0. 131。 
两者之间的差异虽然小(一般来说，这种差异会随着样本的 
增大而减小)，但却是系统性的。较小的标准误在统计上是 
有利的，由于它意味着更高的估计精确性，因而也是更好的。 

SEM 相对于回归方法的优越性在于它会减小标准误， 
因为结构方程模型中所有的参数是被同时估计的。分别拟 
合三个回归模型会导致偏误，其原因是存在缺失变量。相 
反，在一个模型中同时对所有关系进行建模，在统计上总是 
优于以零散的形式分别进行建模，因为(对某种关系的)估计 
能够在统计上控制或者排除其他关系（的影响）。因此，上述 


经验分析结果并非某种巧合，也并非因为数据示例具有特殊 
性，相反，它是由统计理论所决定的，这种统计理论即指同时 
拟合的方程会得到更一致的估计。不管在理论上还是在经 
验上，拟合一个 SEM 模型都会比拟合三个回归方程得到更 
有效、更精确的估计。同理，既然 SEM 最大似然法与普通最 
小二乘回归相比会得到更小的标准误，那么，检验中介作用 
存在与否的 z 检验“在一致性上最具效力”的这种说法就更 
加适用于 SEM 而非回归方法，这一点不足为奇。~ 

在拟合一个联立模型时，对所有参数和标准误（它们构 
成了 z 检验的组成部分)的估计都是以模型中所呈现的同一 
批影响效应为条件的。对 X—M、X —y 每一种影 
响效应的估计都在同样的建模情境下进行，而在回归方法建 
模中，在对和 x-y 的影响效应首先进行估计的模型 
中是不存在其他影响效应的，这使得每一种影响效应既无法 
与其他任何一种影响效应比较，也无法与全模型{X，4 
Y 进行比较。目前，2检验都是在估计了不同的回归模型之 
后得出的,而这些回归模型的估计却是以预测变量的不同组 
合为条件的。简言之，回归方法比较的是苹果和柑橘，而结 
构方程模型则(真正)比较了苹果和苹果。 

在(寻求)较小的标准误的驱使下，最近对 SEM 和回归 
分析方法进行比较的研究都用到了一系列蒙特卡罗模拟 (Ia- 
cobucci, Saldanha&. Deng, 2007)。 模拟研究的长处在于，总 
体参数是建构的和已知的，因而研究者对总体中的真实关系 
有所把握，故其逻辑就是研究回归方法或结构方程模型能够 
在多大程度上正确地发现和复原这种关系模式。这些研究 
的结果都表明，对各种规模的样本来说， SEM 都比回归方法 



如,75%和100%的中介作用），其优势最大 


第 4 节 I 拟合测量模型 


下面，我们来考虑一下对数据拟合测量模型时的一些概 
念性和实际性的议题。首先讨论三变量模型，其次引入多重 
测量，之后提供 LISREL 语句并对其进行解释。 

通过 SEM 拟合基本的三变量中介结构 

当使用 SEM 这一工具来分析中介作用时，只有一个模 
型会被拟合。对 X—y 这些作用路径的估 
计会同时进行。研究者并不是用回归方法来拟合一系列的 
方程或模型。这个结构方程模型 遵循： 

y= rx+By+^ [3.20] 

在方程 3. 20中， x 被称为“外生变量”，而 y 则同时包括 
了 M 和V，它们被称为“内生变量”(基本上，X没有预测变 
量，但 m 和 y 都有一个或几个预测变量)。中介分析的主要 
兴趣在于结构参数 r 和 b 。 这些矩阵有如下 形式： 

X M Y 


_Mry MX i 一 Mp5U=0 知 = 0*| 
J ~ yL ^ 扣= 0」 



在矩阵 r 中，外生变量(或概念建构）构成了列,它对行 
上的内生变量 M 和 y 的作用分别是 w 和矩阵 B 大 
部分由0构成（对应于没有被估计的作用路径，例如， y- 
M), 但知 f 项需要估计，它代表了 M-Y 这一作用路径。我 
们很快就会详细解释矩阵 r 和 b 中的各项，但为使这里的论 
述更加完整，我们还需指出，矩阵平也要被估计，它相当于内 
生模型在拟合方面的欠缺性，即试图预测 m 和 y 时 lji? 2 
的值： 

m y 

°1 

yL o %」 

回到最为重要的结构参数，如果存在一个显著的 X-Y 
作用路径(即的估计值），就意味着 Y 的变异中至少有一 
部分可以由 y 与X之间的直接关系来解释，并且，纳入一个 
中介因素本身并不能充分支持X影响 Y 这一过程(事实上， 
这一中介作用路径可能并不必要)。如果 X—M 和两 
个作用路径(即^和&)都显著，那么 y 的变异中至少有一 
部分可以由 y 与 x 之间经由 m 发生的间接或中介关系来解 
释。如果这两个间接作用路径 (X-JVf 或 M-Y) 中只有一个 
显著，那么中介作用逻辑可能会留待以后的研究来确定（例 
如，不显著的那个作用路径可能使用了不可靠的测量工具， 
或者研究所使用的样本规模不够大），但当前的研究结果并 
不能支持存在中介作用这一结论。 

如果和两个路径系数都显著，研究者就应 
该进行后续的 Z 检验。这一后续检验在 SEM 方法中仍然重 
要，因为不管 X-Y 是否显著，问題在于评估中介作用相对 


于直接作用的大小。假如 x—M 的估计值为 0. 7, M-Y 的 
估计值为 0. 6, X-Y 的估计值为 0. 3,再假定前两项作用显 
著而后一项作用不显著。从本质上来讲，这可能支持了中介 
作用而非直接作用假设。然而，上述显著性检验只是表明了 
0. 7和 0.6 都分别大于0, 0.3 并不大于0。但是，间接作用 
可能并不显著地大于直接作用。也就是说， 0.7 可能并不显 
著地大于 0. 3,与之相应，间接作用的乘积 0. 7 X^O. 6也可能 
并不大于0.3。而 z 检验就直接比较了间接作用 7X0. 6) 
与直接作用 (0. 3) 的相对大小. 

虽然 z 检验的形式与方程 2. 4相同，但 SEM 的优势在 
于，该检验中的所有成分——包括系数 a、 6以及它们各自的 
标准误一都来自同一个模型，即方程 3. 20。由于每 
一个估计都是在同样的基础上，即排除了所有一系列类似的 
其他效应后得到的，它们就在最大程度上实现了无偏性。 

为使本书对那些希望使用结构方程模型来检验中介作 
用的读者更具实用性，我们将会把这些统计和矩阵概念转换 
为软件指令。我们现在就来呈现运行上文提出的每=个模 
型的 LISREL 语句，因为 LISREL 可能是最流行的 SEM 软件 
包。 [18] 在本书的附录部分，我们提供了用其他流行的软件包 
(SAS 的 PROCCALIS、EQS 和 AMOS) 来拟合基本中介模型 
的语句。我们虽然会对这些语句进行解释，但却只限于简单 
的解释，读者需要对 LISREL 有一定的了解 （Jdreskog & 
Sorbom, 1997)。我们从运行最简单的三变量模型人手来解 
释 LISREL 语句(一个三变量模型已经涵盖了已有文献中的 
大多数中介分析，但我们希望在本书阐述了若干种扩展形式 
之后，能够在将来的研究中见到更复杂的分析和推理)。 



的路径模型，因为 y 或内生变量（即 m 和 y) 的数目与内生 
(eta* 7 ) 概念建构的数目都为2。同样，X的数目与外生 
(ksi 和0概念建构的数目都为1。因子矩阵 lx 和 ly 被设定 
(“fi”) 为恒等 (“id”) 矩阵(这再一次表明指标变童与潜在变量 
之间是一一映射的），基于同样的原因，测量误差矩阵 td 和 te 
被设定为0 9 我们随后会对 eta、ksi、lx、ly、td、te 矩阵作出 
更详尽的描述一当中介作用中的基本概念建构是用多个 
变量来表示时，这些矩阵会更有用。 

B 和 r 矩阵是由模式 (“pa”) 来界定的，它指明哪些作用 
路径应该被估计(即“1”)，哪些则应该被设定为 0( 即“0”)。 
软件对这两个矩阵的读取类似于假定一个列变量在影响行 
变量。因此， B 矩阵中唯一的“1”，即体.，，表明第一个内生变 
量(根据 “se” 对变量的列举顺序，即 Af) 对第二个内生变量 





有多重测量时用 SEM 拟合中介作用并纳人测量模型 


研究者知道，当用多项式置表来测量X、 M 和/或 Y 时， 
会提高其可靠性，也会有助于厘清这些测量題项所代表的概 
念建构之间的关系本质。 [19] 如果出现了多项式量表(例如， 
用X,、 X 2 、 X 3 来测量自变量X这一概念建构），研究者则不 





清楚如何应用回归方法来检验中介作用（例如，将 X,、x 2 、 
X 3 代入方程 2. 1至方程 2. 3时,会由于多元共线性问題而造 


在这种情况下，研究者通常会计算多项式量表的均值， 
歹，再将其代入类似于方程 2. 1至方程 2. 3的方 
程体系中，即方程 3. 15至方程 3. 17。然而，虽然通过对多 
重测量取均值（即，{兄， X 2 , X 3 }— 又)来简化分析十 t 常 
见，但这种做法并没有充分利用数据的全部优势，相反，用 
结构方程模型来拟合中介作用结构却可以在一个测量模型 
中体现这些多重测量题项。如果将和 y 的多重测量 
汇总为均值加以分析，再将其结果与使用一个完整的结构 
方程模型（即同时包括了测童模型和路径模型）所得到的结 
果进行比较，或许毫不奇怪的是，后一种结果会更具优势 
(Iacobucci et al , 2007)。完整的结构方程模型正确地识别 
了研究总体的特性，并几乎完全复原了由中介关系所导致 
的那部分变化，但对均值的分析则高估了中介作用的程度 
(例如，这种分析会偏向于得出样本中存在部分或完全的中 
介作用这一结论，即使是研究总体中并不存在任何中介作 
用时也会如此)。 

因此，当用多项式量表测量X、 M 或 y 时，研究者若通 
过取其平均值而不用 SEM 来进行建模，这其实是对数据的 
种损害。在 SEM 方法中，重要的是让数据按照其固有的 
特性来“说话”——如果某一概念建构有三个测量指标，那么 
对中介作用的检验就应该同时纳入一个正确的、同构的测量 
模型和一个结构模型，而不是将数据处理为其均值。计算量 
表的均值可能看似简化了分析过程，但却牺牲了结论在实质 



上和理论上的准确性，研究者会为这种走捷径的行为付出代 
价，这种代价就是，他们经常会得出有关中介作用检验的错 
误结论。 

对数据的建模应该以一种能够代表其结构的方式进行， 
这并不只是一个“理论上的”论断。它也能在实际上对研究 
者有所帮助。在用一个结构方程模型对多重测量进行建模 
时，测量误差被从模型误差中分离出来。因此，概念建构之 
间的关系也被澄清了，并且通常还被强化了。 

所以，研究者应该运行一个完整的结构方程模型，而不 
是将多项式量表汇总为其均值。这个完整的结构方程模型 
由结构模型和测量模型两部分构成，前者说明了 X、 M 和 Y 
这三个概念建构之间的关系本质，后者说明了将这些概念建 
构映射于各自的指标变量的情形。 

我们所说的多重测量题项，是指由三个或更多测量题项 
所组成的量表。在理论上，多重测量也包括由两个題项所组 
成的量表,但由三个或更多題项所组成的量表有助于研究者 
避免欠识别的问题(除非在理论上或经验上有两个或更多的 
题项极其相关)。 Bagozzi 和 Baumgart ner (1994) 建议，由三到 
五个题项所组成的量表或许是最理想的（也就是说,题项的 
数目最少要有三个,而五个以上可能就过犹不及了）。 

在多项式量表的情况下，用 USREL 的标记方法，我们现在 
来区分$和X，前者是指外生变量所表示的概念建构，后者则表 
示测得的外生变量。与之类似, 7 是指内生的概念建构，由 M 
和 y 的变量来代表。完整的结构方程模型由如下结构 方程： 


7=R+B7+^ 


[3.21] 



和下面两个测量模型(分别代表了将 6 映射于 X 和将7映射 
于 M 和 Y) 构成： 


另外两个矩阵 a 和 a 包含了测量误差(其中，与被设 
定为1的因子载荷相对应的误差项被设定为0,其他项则会 
被估计)。 


x' x 2 x 3 
〒，=0 0 
0 , = x 2 0 Q 、0 
X 3 L 0 o 


Mr m 2 m 3 y , 


y 2 


mJ0,=o 0 0 0 o' 


M 2 o ^ 0 0 0 

@ f = M 3 0 0 ft. 0 0 

Y, 0 0 0 良 = 0 0 

L 。 。。 。 


如前文所述，矩阵平包含了内生模型的欠拟合性，类似 
于1 一 i ? 2 。 而$则度量了外生的概念建构（如果外生的概念 
建构不止一个，则捕捉了它们之间的相关关系 ) [2Q] : 

Vm Vy 

vrl _。 平」 e [多] 


LISREL 语句 

对于有三个概念建构、 X 有三个测量指标、 M 有三个测 
量指标、 Y 有两个测量指标的模型， LISREL 语句 如下： 





用结构方程模型来分析 
中介 作用： 结构模型 







结构方程模型由测量模型和结构模型两部分构成。前 
—章关注的是测量模型，这一章关注的是结构模型。 

研究者在试图考察 x、 m 和 y 这些概念建构之间的中 
介作用时，通常都是在一个相对狭窄的视野内进行，也就是 
说，他们往往只将这三个概念建构纳入分析(例如，简短的实 
验或调査，这是为了实现效率)。然而，即使研究者并不明确 
地承认存在一个更广的分析网，所有的概念建构之间的关系 
其实都或多或少地嵌入了一个更大的图景，正如图 4. 1所展 
示的那样。科学哲学家和方法论者鼓励用这种更广的分析 
网来对社会现象提出最丰富的观察和解释 （Cronbach 
MeehU 1955). 例如，在中介作用分析中，一些研究者可能希 
望检验比一般情况下更长的中介作用关系链，比如可能是 
X-M, —M 2 -^Y e 其他研究者可能想探究两个中介系统中 



图 4.1 在一个更广的分析网中 检驗中 介作用 



的哪一个对因变量的作用更强，例如比较这样两个作用路 
径： x— m , — y 和 x— m 2 —y。 

显然，各种可能性是趋于无穷的。幸运的是, SEM 在允 
许纳人多重测量之外，还能够方便地处理超过三个关键概念 
建构 (X、M 和 y) 情况下的理论归纳和模型扩展。更广的分 
析网的各种情况都可以被建模，不管新纳人的概念建构构成 
了原有的三个关键概念建构的原因还是结果。在本章中，我 
们就来考察一下纳入额外的概念建构时所产生的一些问题， 
其中的某些问题已经有了解决方法。 


第 1 节 I 概念回顾 


对中介作用建模的技术发展来说,至少多加人一个概念 
建构(以 <3表示)是尤其必需的，即使研究者更关心X、 M 和 
y 而非 Q(Bentl er , 2001)。加人额外概念建构的主要理论目 
的是提髙分析网的复杂性，这使得根据观察到的数据模式提 
出似乎合理的替代性理论的难度加大，因此保证了结果在统 
计上和概念上都更为确定。 

加入额外概念建构的主要统计目的是改进自由度。中 
介模型就三个概念建构提出三个连接关系，因此，它具有“恰 
好识别”的特征。这种特征的其中一个含义是，影响效应的 
方向在经验上是不确定的，例如，我们不清楚是 X — M 还是 
X (MacCallum et al. , 1993； McDonald，2002» Fien- 
herg, 1981:122 — 123)。 在前文描述的例子中（即 ^ = 
0. 55, r»r = 0.45, r w = 0. 63), X —M—Y 这一中介作用 
的路径系数分别为 a = 0. 55, 6 = 0. 55， c = 0. 15。如果整个 
作用方向是倒转的，即估计值就会出现一定的差 
异，分 别为： 0. 63(y—M), 0.44(M— X), 0.17(Y--X)。 如 
果某研究者提出 X-y-M， 则估计值会是 0. 45(X—Y), 
0.48(y—M), 0. 33CX-*M)o' 更大的问題是，三个模型（以 
及更多的模型)的拟合统计量并无二致，都是完美的（例如， 




第 4 章用结构方程模型来分析中介 作用: 结輞模坦 


Bentler 的比较拟合指标 CFI 都等于1，均方根误差 RMSE 都 
等于0)。⑽ 

理论应该有助于区分可相互替代的模型(这是以参数估 
计值而非总的拟合统计量为基础，因为前者是可变的而后者 
则不是），但是，具有竞争性的模型很少被文献所提及，也更 
少被检验。而且，从同一个理论视角导出的竞争性的因果模 
型可以具有同样的合理性。例如，如果 X = 爱好，认 
知， Y =行为，支持 X—M 或者 M-X 这两种相反理论的模 
型会同时存在，同理，支持或者的模型也会同 
时存在，以此类推 (Breckler, 1990)。 

使用多项式量表并不能解决这一问题。虽然原始协方 
差矩阵确实变大了，这也导致自由度的增加，但多余的自由 
度却是“虚假的”，因为它们是对测量模型的准确性有贡献， 
而不是对关键的结构模型的自由度有贡献。无论测量了多 
少个题项，只要有三个概念建构，就有三组概念建构之间的 
相互关系，并且，如果我们试图在中介分析中估计三个路径， 
那么模型就是“恰好识别”的。然而，四个概念建构就会有六 
组相互关系。在这种情况下，如果要估计四个路径，那么就 
有两个多余的自由度可以用来检验竞争性模型的拟合优越 
性。我们偏向于这种“过度决定”的情形，因为在这种情形 
下，未知项的数目要少于系统中的方程数目或数据点数目， 
由此得出的每一个估计值都可能会更加确定。 

当加入一个新的概念建构 Q 来依次作为X、 M 和 Y 的 
一个原因或结果时，就会相应地多出一个路径，图 4. 2展示 
了这些路径所有可能的位置。在正式的研究中, Q 的位置会 
由理论规定，但在这里，我们会考察 Q 的各种不同角色以澄 



清关于结构方程模型和中介作用的几项要点。图中每个递 
归的、可识别的结构模型都达到了增加自由度以对模型的拟 
合性进行评估的目的，也就是说，任何一个模型都不具有人 
为的完美拟合性。然而，我们必须说明的是，六个模型并不 
是等价的，其中模型 C 和模型 e 尤其不应该被使用。 

(J^) 

(a) (b) <<0 



(d) (e) CO 

图 4. 2 通过加入一个路径来引入一个 新的裱 念建构的所有可能的 组合： 
C2 作为X、 m 和 y 的一个单独的黡因或结果 



第 2 节 I 举例说明 


用结构方程模型来分析中介作 用:结 构棰型 


让我们从前面一直用到的例子开始解释，在该例中， 
rrn =0.55, rxt = 0.45, r m = 0.63,得到的路径系数为 
a =0. 55, 6 = 0. 55, c = 0. 15。这些估计值显示在图 4. 3的 
右上角，代表了“基准模型”。现在让我们通过加入第四个概 
念建构 Q 来增加这些相关关系。为了说明的简便，令^ = 
W = a = 0. 40。在模型 a、 模型 b、 模型 d 和模型£中，三个 
关键路径系数的估计值没有发生变化，而且，凡是涉及 Q 的 
连接，其相关系数一律为 0. 40,准确地反映了输人的信息。 


基准模型 



(e) 见图 4. 4 


图 4.3 G 对和 V 之间的中介作用的影响 


模型 c 和模型 e 见图 4. 4。这两个模型的表现有所不 
同，因为将 <3作为 M 或 Y 的一个原因加人模型，意味着出现 
了两个外生的概念建构(X和 Q) ，这就带来了一个统计上的 
(也是概念上和经验上的)要求，即它们之间的相关关系也应 
该被呈现出来并加以估计。因此，首先要弄清楚的是，虽然 
(图 4. 3中的)模型 a、 模型 b、 模型 d 和模型 f 带来了两个自 
由度，但(图 4.4 中的)模型 c 和模型 e 则只多带 f 了一个自 
由度(另外一个自由度在估计两个外生概念建构$间的相关 
关系时被使用了）。 



(c’）r.a*-0.7 (e) r's=0. 7 

图 4.4 不要将 (2 作为 M 或V的一个原因引入模型 


更成问题的是，三个关键的中介作用路径系数不再是不 
变的了。在模型 C 中, Q (与X—起)构成了 M 的一个预测因 
素，结果是, Q 和X之间的多元共线性使得两个估计值分担 
了预测的方差，因此，的路径系数不再与输入的信息 
0.40 相同，而且的路径系数也不再是我们所预期的 
0.55( 即不再代表研究总体的已知结构）。但要注意的是，与 
预测 Y 有关的路径并没有受到影响。相反，在模型 e 中，由 



为了便于说明，我们将所有的0.4(即0与叉、％和7之 
间的相关关系)都替换为 0. 7,模型〆和模型 e' 显示了这会对 
结果造成什么影响。多元共线性的增强产生了更加不同的 
结果(包括使其中一个作用路径的方向发生倒转，这表明 1系 
统为了抵消新出现的高度线性相关而产生了一个抑制性的 
关系）。 

从某种意义上来说，这些模型的结果肯定是“真的”，也 
就是说，当 Q 与和 y 在任何程度上相关时(即只要相 
关度大于 0) ，路径系数的估计值就是上面所报告的那些数 
字。但是，如果研究者的视野主要关注的是 X、M 和 y， 为了 
不扰乱最核心的关系，最好还是为 Q 选定一个角色，也就是 
说，将 Q 作为X的一个原因引人模型，或将 Q 作为X、 M 或 
y 的一个结果引人模型。 

上述结果概括了在哪些情况下 r ；^、 这三个核心 
指标会发生变化，而不管数据中的中介作用强度有多大(例 
如，是25%还是50%,或者是75%)。而且，加入的相关关系 
^的强弱变化也会对结果造成影响(正如 0.40 与 
0.70 的结果对比所显示的那样）。 



用文字表达就是 :“完 全的中介模型是这样预测的，即 X 
对 M 有一个直接的作用，从对 y 有一个直接的作用，并且当 
M 保持不变时，X与 y 之间不存在直接相关。”请回忆一下我 
们之前给出的提醒，这个偏相关在几种情况下是一致 的:假 
设的 x-M-y 这一中介作用，倒转的因果关系链 y-M- 
X，或者 m 是 x 和 y 的一个共同决定因素，即 x-M-y 
(McDonald, 2001)。在 SEM 中，这些关系的等价性会导致 
在没有 Q 的情况下，这些模型的总的拟合统计量将是相同 
的: 所有的拟合优度测量(例如， R 2 ) 都将等于1，所有的拟合 
劣度都将等于0。「 23 ：1然而，首先应该拟合我们所期望的中介 
模型，如图 1. 1所示，然后才继续拟合替&性的或竞争性的 
模型——这可以从 Y-M-X 开始，再对起中介作用的概念 
建构陚予其他的角色，例如 M-x-y 或; c—y-M ― 并且 
表明，虽然总的拟合统计量可能是相同的，但某些模型的参 
数估计却并不显著，或者不具有理论上的意义。 

加入 Q 之后，多余的自由度允许我们比较模型的拟合 
性。但是坦白地讲，在只多出两个自由度的情况下，会出现 
两个 问题: 首先，模型的拟合性可能只在某种程度上可以进 
行比较;其次，对太多的竞争性模型进行比较会导致过多的 
I类错误 (type I errors) „若在经典的中介模型 X-M-y 
中加入X，则基本的拟合性指标 如下： GFI = 0.96, 
RMR=0.09, CFI = 0.96。 当整个因果关系的方向发生倒 
转，即 Y — (加入 Q-X) 时，模型的拟合性 如下： GFI = 
0. 91, RMR = 0.20, CFI = 0. 86。当检验 M-*X-^Y 这一作 
用模式时，拟合指标如下： GFI = 0.98, RMR = 0.038, 
CFI =0. 99。这一组指标表明，最后一个模型具有少许优势， 




第 4 章用结构方程模型来分析中介作 用:结 构樓型 | 

尽管这正是我们所预料的。 

如果没有额外的概念建构，最核心的三概念建构模型是 
“恰好识别”的，换言之，许多竞争性的模型同样会很好地拟 
合数据。 MacCallum 等人 (1993) 详细讨论了 SEM 方法中的 
模型识别和替代性模型的问題。即使统计上不存在等价模 
型这一问题，对希望取得进展的研究者来说,强有力的理论 
对于他们支持或反对某些形式的中介作用也是必不可少的 
读者可以思考下面这段文字： 

一个拟合性好的模型必须能够准确地再现观察到 
的数据。然而，即使发现了某一模型与数据具有一致 
性，几乎总有替代性的模型同样具备这种一致性…… 
Stelzl(1986) 发展了几条规则来帮助生成一系列等价模 
型……两个等价模型将会同样有效地解释同一个观察 
到的协方差模式，它们各自的总拟合优度统计量将会相 
同……然而，两个等价模型对单个参数的估计值会有所 
不同，这就为两者的区分提供了一些基础。 （Breckler， 
1990,262) 

注意，避免过度地将相关数据解释为中介作用（或其他 
的因果关系结构）的证据是相当重要的，用理论来补充经验 
结果也很重要。有鉴于此，我们再提供两个例子来加以说 
明。首先，想象一下两种完全的中介作用的情形。其中一种 
情形是中介因素在概念上或是在时间上更接近于X,这或许 
是因为对 M 和X的测量在时间上或在程序上如此接近，以 
至于方法变异量可能进一步促进了它们之间的联系。这种 






^=0.30,^ = 0.90 0 如果我们对两组数据分别拟合中介 
模型，则第一种情形下的路径系数估计值为 M = o.m P < 
0.05) ， r w = 0.15(p>0.05), ^=0.15Q>>_0.05) (中介 
作用的比例为 47. 4%)»第二种情形下的估计值为= 
0. 30(p < 0.05) , ryx = 0. 03(/» >0.05), pm = 0.89(p< 
0.05)( 中介作用的比例为 89. 9%)。这些参数估计值的显著 
与不显著的情况表明，中介作用在第二种情形下得到了支 
持,但在第一种情形下没有得到支持，尽管在概念上，两种情 
形都显示出存在中介作用的关系链。 [24] 



第 3 节 I 抑制作用 


上面的第二种情形涉及抑制作用的问题，这在中介作用 
文献中已经 有所讨 论。 MacKinnon、KrulK Lockwood(2000) 
比较了中介作用和抑制作用： 


在中介作用中，典型的情况是假设……自变量与因 
变量之间的关系……会减弱，因为中介变量解释了这一 
关系的部分或者全部……然而，可能出现的情形是，移 
除某一个变量可能会增加自变量和因变量之间的关系 
强度。这种改变就意味着存在抑制 作用。 （2000:174) 

他们给出了一个 例子: 想象X是对员工智力的测量， M 
是对他们感觉无聊的程度测童， y 是一条装配线上出现工作 
失误的次数。一位人力资源研究者会期望》^>0，^>0, 
但^可能会是负的。 

对中介关系(以及 SEM) 框架中的抑制作用的一种诊断 
标准是， aX 6 (即X知）的符号与 c (即加）的符号相反 
(MacKinnon et al , 2000： 174; Shrout Bolger, 2002：432； 
Tzelgov &. Henik, 1991) „ 许多社会科学家都听说过抑制作 
用，但对它并不是很熟悉，有鉴于此，另外一个例子在这里可 




能有用。这个例子是由 Shrout 和 Bol ger (2002:431) 提供的。 
假定 X 是某种压力源， M 是一种应对行为, Y 是所经历的焦 
虑程度。一名临床医生会期望〜>0, &<0,于是中介 
的、间接的路径系数应该为负。最终，会是正的。因此， 
aXb (表示中介路径)的符号与 c (表示直接路径)的符号会相 
反，这表明存在抑制作用。 

另一种思考抑制作用的方法是将其与多 元_ 共线性进行 
对比。我们可以看到的多元共线性的例子通常是这样一种 
情况:“一个预测变量本来对结果变量具有较强的影响，但在 
控制了另一个预测变量之后，它的影响就变得微不足道了。” 
而抑制作用则是“一种相反的情形，即一个预测变量的影响 
本来微不足道，但在控制了另一个预测变量之后，它的影响 
变强了” ( Lynn ， 2003:58)。例如，令 Y 为因变量, A 为一个 
预测变量， B 为另一个预测变量，并且， B 与 A 相关 ( r ^^ O ) 
但与 y 不相关= 0) 。如果记（即同时用 A 和 b 来预测 y 
的多元回归方程的记）大于两个简单相关系数的平方和，即 
R 2 > ( A + 淪）， 那么 B 是一个起抑制作用的变量。 

举这些例子的目的是要提醒可能会用到中介模型的研 
究者，那句永恒的谚语“若输人错误的数据,则会输出错误的 
结果”在这里是同样适用的。若没有强有力的、清晰的理论 
总结，包括对竞争性理论进行检验的意图，中介分析的统计 
方法本身是不会变縻术般地澄清数据结构的。 

在下面几节中，我们将用 LISREL 语句来结束本章内 
容,这些语句适用于我们所展示的超过三个关键概念建构的 
情形。在下一章中，我们会转向更加复杂的数据分析情形。 



第 4 节 I 四概念建构模型的 

LISREL 语句 



在第二批输入指令中， Q 是 X 的一个 结果： 

Title： Four Constructs, Figure 4.3b). 
dani = 4no=100na = cai 







第 5 节 I 较长的中介作用链与替代性 
中介路径的 LISREL 语句 





分析网中,对中介作用进行检验，它具体对应的是图 4. 1 甲 
的 结构： 






第 6 节 I 间接效应的显著性 


中介作用最后要考虑的一个问题是区分 x 对 y 的作用 
有多少是直接的 (x-y)， 又有多少是通过中介因素而间接 
实现的 (x-M-y)。 结构方程模型的使用者对这种分解的 
估计和显著性检验进行了探索(参见 Bollen， 1987； Holbert 
&• Stephenson, 2003; Preacher &- Hayes» 2004)。 

在简单的中介作用形式中(例如由图 1. 1 首次展示的那 
样），X对 Y 的直接效应是由系数 c (或者是 LISREL 模型中 
的 7w) 来估计的，X通过 M 对 Y 的间接效应是由相应的结 
构系数的乘积(即 aX6, 或者是 LISREL 模型中的 yAK X 知） 
来估计的，X通过直接和间接路径对 Y 的总效应是两者之 
和: [H-(aX6)] 0 

将总效应分解为直接效应和间接效应，这在大多数 SEM 
软件中都可以通过一些选项或设定来实现。例如，在 LIS~ 
REL 中，若在输出行中加入关键词 “ e f”, 就可以得到直接效 
应、间接效应和总效应的估计值。 

从统计计算软件包的输出结果可以得到直接效应、间 
接效应以及总效应，也可以得到这些单个项的显著性检 
验。理论上，方程 2.4 中的 z 检验类似于间接效应的显著 



(显著或不显著），即使实际数值存在某种程度的差别。最 


后，不管直接或间接效应显著与否，都有待研究者作出一 
个科学的判断，并对直接和间接作用路径的相对大小进行 
总结。 



第 7 节 I 其他议题 


如果研究者有额外的概念建构，如图 4. 1或图 4. 3,就有 
更多的自由度可以使用。而当存在更多的自由度时，就可以 
获得比较性的拟合统计量，也就是两个嵌套模型的X 2 值之 
差(即 AX 2 , 类似于回归中的 AR 2 , 例如，用X、 M 来预测 y 
的模型1嵌套于用 x、 m 、 q 、w 来预测 y 的模型2,于是，两 
个模型的X 2 值之差 AX 2 = X|—X|, 自由度之差 M/ = 
dfx —奶) • 

层级嵌套模型并不是必须的，然而，拟合这些模型却为 
研究者提供了又一个优势。但问題在于，不管是用旧式的回 
归方法还是用更适当的结构方程模型来拟合，对中介作用的 
考察几乎肯定会在预测变童之间具有多元共线性的数据中 
进行。要作出中介作用存在的结论，其中一个条件是X与 M 
有关，即(中介作用的前半个路径）。于是，当关注 Y 
的预测和解释时，对直接路径(包含X)和间接路径(包含X 
和 M) 的估计是通过两个本来就相关的预测变童来进行的， 
而这正符合多元共线性的定义。 

多元共线性影响了结构方程模型中的结构路径系数沒 
和 y (或者是回归中的 /?) 的估计值、显著性检验以及对它们的 
解释，但并不影响总的拟合性指标(X 2 或 i? 2 ); 多元共线性影 



点，即由于人们感兴趣的任何数据都会自然而然地显示出某 
种多元共线性，因此需要对#和 y 的估计值进行检验。拟合 
一个联立模型——它同时包括了直接连接 (x-y) 和间接连 






本章将考察一系列更加复杂的数据情形， 研&者 试图理 


解其中的中介作用关系。首先，我们将 SEM 应用于“中介性 
的调节作用”。一般说来,“调节作用”可以简单地解释为有 
一个交互项捕捉了一种条件性的关系。在中介性的调节作 
用中，交互项与因变量之间的关系是中介性的。 

其次，我们将转向“调节性的中介作用”。在这种情形 
下，我们关心的问题是某些变量是否对中介作用具有调节 
性，或是否调和了中介作用的强度。最简单、最常见的情况 
是，对于两个群组来说，研究问题是要弄淸楚中介作用是否 
只在一个群组中存在而在另一个群组中不存在。也就是说， 
如果在一个群组中有中介作用 x—y， 但在另一个群组 
中只有直接关系 x—y， 那么这个分组变童就是调节项。调 
节项可能会更加复杂(例如，可以是一个连续变量，而不只是 
对两个群组进行区分)，我们对此也会加以考察。 

第三，我们将考察研究者在遇到定类变量时应该怎 
么办。 

第四，我们将探讨纵向数据所产生的问题。 



第 1 节 I 中介性的调节作用 


探究中介性的调节作用，就是考察涉及一个交互项^中 
介模型 (Muller, Judd &- Yzerbyt, 2005). 当进行一项矣襄 
时，研究者操控不和不两个因素，经典的方差分析会将因 
变量 Y 模型化为由两个主效应以及它们的交互项尤 *X 2 
所构成的函数。同样，在中介分析中,调节作用也是由一个 
交互项来表示的，没有什么特别之处。 

此时的中介作用分析与通常的情形一样，只不过涉及了 
一个调节项，也就是说，研究问题仍然相似，即到底存在一个 
直接作用 {x, y 还是一个间接的中介作用{不 * 

x 2 }—M-^y„ 

如图 5. 1所示,主效应也被纳入模型，这是为了达到统计 
控制的目的(以排除低阶项以及与其有关的但却属于外来的 
方差和协方差），然而，它们并不是研究的关键和实质性兴趣 
所在。为了回答调节项是否具有中介关系这一问題，我们关 
注的是评估间接路径参数估计一 aX6( 即 /M.X..X. X 
Am ) ——与直接路径参数估计 c (即斤 < 4 ) 的相对大小。 [25] 



如果理论要求检验中介性的调节作用，那么就应该用这 
些方法作为检验的手段。然而，虽然交互项在对实验中操控 
因素的方差分析中十分常见，同时也确实是研究者所期望 
的，但已经有文献表明，当概念建构被操作化为连续变量进 
而用它们的乘积项来表示其交互作用时，是存在一定问题 
的。应用包含连续型预测变量以及它们的乘积项的广义线 
性模型时所产生的问题，在这里也适用。研究者在生成乘积 
项之前应该特别对主效应变量进行均值对中处理,以减少乘 
积项与其组成部分之间的多元共线性，并且，研究者或许应 
该根据数据作图，以检验生成的乘积项在多大程度上导致了 
棘手的非线性特征，从而使线性模型可能不再稳健 (James 
Brett, 1984:310), 等等。 [ 26 ] 

如果预测变童应该由多项指标来表示，那么它们各自量 
表的均值就应该相乘以得到一个单一项来表示交互项。例 
如， X U 、X, 6 、 X u 会被简化为I ， Xu 、 瓜被简化为 
X 2 , 由此得到一个乘积项 兄 X瓦。 

总而言之，对中介性的调节作用来说，主效应因素基本 
上是被当做控制变量(这与方差分析相似)纳人模型的，因为 
研究者对不 * X 2 如何起作用更感兴趣。至于 X '— M 、 
XfM 、 x 2 -y 这些路径是否显著则无关紧要。研 
究将这些估计置于一边，只关注足 * x 2 - m , X, * x 2 -y 
这一中介作用估计。 

用来拟合图 5. 1所示模型的 LISREL 语句 如下： 




最后请注意，我们有足够的自由度来估计这个模型。模 
型中一共有五个概念建构，所以，我们会从10个协方差中提 
取一部分来估计七个路径。 



第 2 节 I 调节性的中介作用 


“调节性的中介作用”这一概念反映的是这样一种想法， 
即中介关系是以某一调节变量的取值为条件的。例如，中介 
作用只存在于一个样本而非另一个样本，或者中介作用有可 
能随着其他某一变量的增加而增强等等 （Muller et 吐， 
2005) 0 

典型的情况是，调节变量是一个定类 变量; 更常见的情 
况是，该定类变量只取两个值。也就是说，有两个群组，此时 
研究者的兴趣是要确立证据表明在一个样本组中存在某种 
中介关系，而在另一个样本组中则存在某种直接关系。对群 
组的定义可以依据实验所设定的条件，也可以依据个体的区 
别性变量，例如，性别或者以特征测量量表的中位值对人群 
进行划分等等(调节变量为连续型变量的情况较为少见，其 
处理方法会在本章的末尾加以讨论)。 

用旧式的回归方法来检验调节性的中介作用是相当困 
难的。回归分析技术会用到定义组别的虚拟变量以及它们 
与各路径系数的交互项，但这种方法相当笨拙。 SEM 自然而 
然地有一个在方法上与此对应的技术可以实现上述实质性 
的分析任务。在 LISREL 和其他 SEM 软件中，都有语句选 
项可以用来拟合多组结构方程模型。以图 5. 2为例，该模型 



说明的是，每个群组都有三个路径，但本质上的理论预期是， 
直接连接 c 在一个群组中显著，而由 a 和6的估计值所表示 
的间接路径却在另一个群组中显著。 



图 S.2 调节性的中介作用 


对该模型的估计过程是，输入第一个协方差矩阵，用所 
有三个(直接和间接)路径来设定模型。接着在语句中(下文 
很快就会给出）输人第二个协方差矩阵，这时使用者既可以 
将两个群组中的系数模式设定为相同,也可以将跨组系数设 
定为相等(即它们跨组“不变”)。 

如果研究者只有三个关键概念建构 x、 m 和 y, 要求在 
两个样本组中都拟合同一个关系模式会导致两个样本组都 
出现完全拟合(原因在于前面所说的模型识别的问题）。参 
数估计值可能会有所差异，并且这些差异可能足以使研究者 
对两个群组作出区分，即在一个群组中确立了中介关系而在 
另一个群组中确立了直接连接。例如，我们用 a 表示组I 
中由中介作用所解释的 Y 的变异比例， A =(兩 X^/Ca.x 
知） ) ，用九表示组 n 中由中介作用所解释的 y 的变异比 
例，/> 2 = (azX^/C^X^^+Ci), 我们可以用一个标准的 z 
检验来比较这两个比例的相对 大小： 


P\ — Pz _ 



a , b = b\ c = c\ 并且，试图展示调节性的中介作用的研究 
者会期望统计量表明该模型（即将参数设定为葙等的模型） 
并不拟合数据。 



fi be = fu, fr ga = fu, fr 


0.30 1.00 


在上述语句中，第二个模型 (“mo”) 陈述句使用的是 “ P s” 
或 “same pattern” 选项（为了在两个群组中得到很可能不同 
的参数估计值)。当研究者拟合“不变性模型”时，则应该使 
用 “in” 选项。 

让我们来看一个调节性中介作用的例子。建立一组数 



对调节性的中介作用进行这种处理的前提是调节变量 
为定类变量，不管该定类变量是取两个值还是取更多的值， 
多组分析都能够轻易地容纳两个或多个群组。然而，当调节 
变量并非一个离散变量时，就产生了如何进行建模的问题。 
下面我们就来解答这一问题。 

假设我们现在只需对 x—y 进行建模。如果我们提出这 
样一个问 题:“ 这一关系是调节性的吗?”我们就会引人一个调 
节变量的主效应(这是出于统计控制的原因 ） 和交互效应，于 
是一共引人了两个新路径 : Mod-Y m{X*Mod}-*Y 0 

在完整的中介作用情形下，我们的处理过程与前面类 
似。 S 卩，如果调节性的中介作用中的调节变量是连续型的， 
我们就引入 MW —y 和 {X*Mod}-^Y, AW —M 和 



被纳人模型，但中介分析只关注“通常的”三个参数，即 a、 6、 
Co 在图 5. 3中，项目更多，并且它们几乎都只是被用来实现 
统计控制的。图中突出显示的路径 a、 6、 c 是我们所关注的， 
但对它们的解释会稍微复杂一些。 



图 S.3 调节性的中介作 用:连 续型调节变置的情形 


假设上述模型中的调节变量是外向性的一个测量，较髙 
的数值表示受访者更加 外向。 当路径 X-HVf 对个性外向的 
人来说更强时，系数会 为正; 当路径 M-Y 对个性外向的 
人来说更强时，系数6也会为正 ; 当路径 X-Y 对个性外向的 
人来说更强时，系数 c 也会为正。路径系数 a、 6、 c 的强度仍 
然可以用方程 2. 4中的 Z 检验来比较。 

显然，这一分析技术包含了对一个只有两种取值的调节 
变量的建模，对后一种情况的分析应该(大体上)类似于前面 
讨论过的多组分析。假设根据外向性测量的中位值将样本 
一分为二(就使原来的连续型调节变量转化成了一个二元取 
值变量），将内向的人编码为0,将外向的人编码为1。在这 
种情形下，如果对个性外向的人来说有路径 X—M， 那么系 
数就是正的;如果对个性外向的人来说有路径 M-Y， 那么 
系数6也是正的;如果对个性外向的人来说有路径 X-Y， 那 
么系数 c 也是正的。编码 (0/1) 规则可以反过来，如果这么做 



的话，这种再分析就等于是从个性内向的人的视角对数据进 
行了互补性的解读。 

请注意，我们有足够的自由度来估计这一模型。模型中 
有六个概念建构，所以，15个协方差为估计八个路径提供了 
足够的信息。 



第 3 节 I 定类变量 


用来检验中介结构的传统方法和 SEM 方法可以很每地 
处理连续型变量（即使是以五分或七分法测量的变量）。然 
而，社会科学中的许多重要变量都越来越多地在本质上是离 
散的或定类的(例如，是/否)。在本节中，我们会阐释如何在 
中介作用研究中处理定类变量。 

例如，在行为决定理论(或者判断和决定过程）中，一名 
研究者可能对如下问题感兴趣 :一种 人格特征——如风险偏 
好(X)—是否通过当前的生活评估 (M) 影响了参与极限运 
动的决定 (Y) (这里 Y 是定类变量)？或者，专家意见(X)是 
否通过品牌选择 (M) 影响了顾客满意度 (Y) (这里 M 是定类 
变量)？同样，政治意识(X)可能是连续型的，政党归属 (M) 
是离散型的，对总统某项行动的态度00是连续型的 (Win- 
ship &• Mare, 1983)。 

有时，信息本来就是定类的，例如性别或种族。有时，连 
续型信息被进行归类处理，例如，将家庭收入转化为三个或 
四个阶级以反映社会经济地位，或者是根据测量受访者某些 
特征的量表得分中位值将样本一分为二等。 [27：I 

在中介分析中，如果X是定类变量，则问题不是很 
大——路径 X—M 和 X—y 可以通过结构方程模型中的虚 



定类变量的问題实质 


我们首先考虑一个经典的情形，即将潜在的连续变量作 
为定类变量处理会导致“信息损失”，其结果是 r 涉及该定类 
变量的经验关系的强度被减弱了。表 5.1 包括了八个反映 
中介作用的结构方程模型的结果。我们生成了含有10000 
个观察个案的数据,并使其显示出25%的中介作用第一 
行，即模型 A， 将三个变量X、 M 和 Y 都处理成其原有的连 
续型形式，因此，其结果在本质上反映了数据的真实情况，而 
我们将会用其他的数据处理方式与其进行比较。 

表 s.i 将连续变量 x、M、y 处理为二元取值变置 
模型 x M y 祕妊 ） 略 ^ 






取值变量。对各个模型的比较只列出了值得注意的那些结 
果，但正如表格所示,这些比较结果并无令人惊异之处。 

比较标记为 “fl” 的那一列中的数字，它表示的是路径 
x - m 的参数估计值。当 y, 即没有包括在该路径中的变 
量，被处理为定类变量时（即模型 B)， 路径 X-Af 的系数并 
不受到影响（与模型 A 相比较）。但当 M 被处理为定类变 
量时(即模型 C 和模型 D) ，或者当X被处理为定类变量时 
(即模型 E 和模型 F), 该估计值变小了。当 M 和X都被处 
理为二元取值变量时(即模型 G 和模型 H) ，与使用原有的连 
续型形式的模型相比，该估计值进一步变小。在对应于路径 
X—y 或 M—y 的列中，有类似的观察(例如，对路径 X-Y 来 
说，将模型 A 分别与模型 B、 模型 E 和模型 F 进行比较;对路 
径 M-y 来说，将模型 A 分别与模型 B、 模型 C 和模型 D 进 
行比较)。 

另一种思考“信息损失”的方式是一个二元取值变量(本 
来就是二元取值或者本来是连续的但后来被转换成二元取 
值)的方差变小了(例如，极端的情况是4 = 0)。因此，它作 
为预澜变量来解释某一因变量变异的潜力就变小了。 

表 5. 1的中介模型还可以有另外一种不同的观察方式。 
假如比较的关系多于一个，则当一个路径减弱时，总效应似 
乎会使另一条路径有所 强化。 例如，在标记为 “c” 的那一列 
中，当中介变量 M 被处理为定类变量时，对路径 X-Y 的估 
计相对变强了（比较模型 A 和模型 C).。 在 M 上的信息损失 
削弱了 M 与其他变量之间的关系（具体来说，是 X-M 和 
M-V) ，但却有效地强化了除 M 之外的变量之间的关系(特 
别是 X—Y)。 同样，在第三列中，当X被处理为定类变量时， 



路径被强化了（比较模型 A 和模型 E)。 这些结果虽 
然是“正确的”，但它们应该提醒了研究者，对一个变量的处 
理方式明显会影响到(数据中的）变化是直接从 x 到 y 还是 
通过 M 间接发生的这一结论。 

假如一名研究者希望得出这样的结果，即中介路径是如 
此之弱，以至于应该将概念图示看做是直接的（即 X—Y 支 
配了 x—M-y>， 那么他/她只需简单地将中介变量 m 进行 
定类处理，就能为这种说法提供经验依据。相反了持中介作 
用假设的研究者可以将X处理为离散变量，就像有些研究者 
用实验中的操控因素或者将群组作为自变童一样。当然，对 
数据进行这种处理会掩盖潜在的真实效应并产生误导性的 
结果。因此，这反而提出了一种道德上的要求，即试图支持 
某种直接效应的研究者可能需要确定中介变量 M 是连续的 
而不是离散的，而支持某种中介路径的研究者需要确定X是 
连续变量。至少这些研究者应该设定更高、更保守的准则来 
确保中介作用统计量是清楚明确的。 

上述阐释的目的并不是批评将连续变置处理为定类变 
量来使用的做法。有时候，研究者就只能获得分类信息;有 
时候，研究者在进行某项理论验证时，只需要在逻辑上对几 
组分类数据进行比较;有时候，连续型的测量看起来太过精 
确，因此反而具有误导性，如此等等。研究者必须使用他们 
已有的变量既有形式，或者是适合于他们的总体理论目标的 
变量形式。 [3<)] 上述阐释的目的是要再次提醒研究者反对这 
样一种倾向，即将相关性数据（以及由抽样、测量误差、样本 
截断等原因而造成的有误数据)过于急切地解释为一种因果 
关系链的证据。 



解决定类变量的问題 


在本节中，我们将探索 SEM 方法中与定类数据有关的一些 
技术思想。接下来会作具体阐述，但之后我们会用一些较简单 
的技术来进行总结，这会使那些不揸长技术的读者感到宽慰。 

这类困境的一种解决方法是在中介分析中对三个变量 
进行类似的处理，即全部是连续变量或者全部是定类变量。 
这样一来，它们在测量方式上的不同就不会导致在对直接路 
径和中介路径的相对强度下结论时出现虚假证据。我们已 
经知道如何通过 SEM 来处理三个连续变量。如果三个变量 
都是定类变童，那么对数线性模型就是合适的。 logit 模型之 
所以是合适的，是因为对中介作用的探索是一项预渕性的工 



中介作用分析 


logit(Y) = ln(odds) = ^[x — p(Y =\>] ^5.1] 

就可以将模型写为预测变量的一个函数，而这个函数具有大 
家所熟悉的线性 形式： 

logit(Y) = po +fi x X -h^UVf [5.2] 

拟合这个 logit 模型会得到拟合统计量以路径 X— 
Y 和 M-Y 相应的参数估计。 

X和 Af 之间的关系实际上也被包括在这个模型中，只 
是没有明确地写出来(正如方程 2. 3 —样)。与中介分析的 
回归方法一样，另一个模型 logit(M) =体+ 办 X需要单独被 
拟合，以明确地分解出 X-M 这一路径。例如， Knoke 和 
Burke(1980:43) 推述了一个多方程方法用于对离散数据拟 
合因果关系模型，这种模型拟合是一波接一波地进行的•例 
如，在我们的中介分析应用中，先是再是 M-y。 尽 
管这两个模型都是在相同的统计框架（即 logit) 中拟合的，但 
其结果并没有被放置在一起，因为得出的“路径系数”无法被 
轻易地整合和解释(就像 SEM 中的 aXb 这一间接路径的情 
形)。 Fie n be r g(1981) 阐释了一个类似的例子，其中，成批的 
前兆变量被放人之后的分析阶段中，它们一起预测了终极内 
生变量。他对“路径系数”的解释持保守态度，建议研究者只 
报告其方向而不报告其估计值。 [31] 然而，如果我们倒转 logit 
方程的原有形 式为： 

logit(Y) = In [i —p(y=\) U 


以求解如下 公式： 



并假设路径 X-M 和 M-Y 相互独立以取它们各自概率的 
乘积(就像在 SEM 中计算—样)——称其为 A •(即 中介 
作用的概率），我们就可以通过一个标准的 z 检验来比较这 
一概率与数据沿直接 路径九 变化的 概率： 

y= M - — 

、 PM-PJ 

虽然定类数据的因果关系模型可以按顺序依次拟合(就 
像旧式的回归方法那样），但这样做会使我们回到拟合多个 
模型的情形，而这种统计分析是次优的。关于这一点，我们 
在前面已经讨论过。 

Collins、Graham 和 Flaherty(1998) 对含有二元取值变 
童的数据采取了一个不同的方法来分析中介作用链。他们 
构建了一个从 x 到 m 到 y 的判定树，每一个点上所做的选 
择在概率上决定了它在哪一个点上终结。这种概念图示看 
似特别适合中介变量为二元取值的情况。如果我们将中介 
作用看做由下列连接构成 :先是 X—Af (是)或 X-Af (否)，然 
后是 M (是) -y (是〉 或 m (是) —y (否）以及 m (否) -y (是） 
或 M (否 X( 否)。由此我们就得到一个判定树，它从X开 
始，首先在 m 上分叉(是或否），然后再一次在 y 上分叉(是 
或否），如此则产生了四种终点 状态： 

1. x—Af (是） —y (是） 

2. x — m (是） —y (否） 

3. x —Af (否） — y (是） 

4. X —M (否） —Y (否） 


[5.3] 



如何拟合这四种状态是个问题，因为这不同于二项 logit 
模型中只有两种状态的情况。然而，我们对这四种状态的兴 
趣并非完全相同。状态1代表了中介作用和间接 路径; 状态 
3表示的是从X到1^这一直接 路径; 状态2无关紧要（中介 
作用的其中一个路径得到支持，但另一个却并未得到支持)； 
状态4也没有什么意义(直接和间接作用都不明显）。因此， 
虽然乍看之下四种状态会要求更复杂的建模，但其实只有两 
种状态有意义一状态1和状态3。 logit 模型可以轻易地对 
这两种状态进行建模，将状态2和状态4排除在外（当成缺 
失数据丢弃)即可。 logit 模型所得到的参数表示了间接路径 
相对于直接路径的“发生比”。一个显著为正 的知意 味着中 
介作用得到支持;若估计值显著为负,则意味着直接路径得 
到支持;对一个不显著参数的一种解释则是存在部分中介作 

遗憾的是，对不显著结果总存在另一种解释，即缺少统 
计效力。 

对所有四种状态的建模感兴趣的研究者可以运行一个 
多项 logit 模型，也就是针对含两个以上类别的因变量的 
logit 模型。例如，想像一个因变量有三种选择(这可以简单 
地延伸至我们所说的四种状 态）: A、B、C。 多项 logit 模型 
用一组预测变量 “x” 来对成组的类别进行建模。为了在概念 
上得到简化，经常是对相邻的一组类别进行建模，它们之间 
的关系为(参见 Long, 1997..150)： 

ln [?cFu)] +ln [?(§l^] = 

我们可以将状态1到状态4作为X的一个函数来建模 
(M 在创建四种状态时已经被包括在内了）。 





度比较。 Winship 和 Mare(1983 : 83 — 84) 根据 SEM 的方程 
(方程 3.2o)^ = ra+By+^,m : 


一 Ly w X+~M +，J 

将X对 Y 的总影响效应分解为两个核心 部分: X对 Y 的直 
接作用与X通过 m 对 y 的间接作用。当 y 是连续变量时， 
我们知道这一总的影响效应是用 SEM 的标记方法就 
是 y«c + (y»« X ~ ) 。相反，如果 y 是离散变量，则 Winship 
和 Mare(1983 : 83 — 84) 从下面的这一基本原则 开始： 

ay , 

dx 一 ax 卞涵 忍 


在给定 x 对 y = 1的概率的期望效应下(假设因变童只有两 
种取值〉代入 logit： 



= 7 yxPy “ 一 Py ) + PmYMxpAl - Py ) [5. 4] 


其中，/ v=/>(y=l)( 当 y 本来是连续的但却用一个离散指 
标来测量时，情况会稍微复杂一些），并且需要在 Y 的各个值 
上来衡量。然而，既然方程 5. 4右边的两部分都出现了 
外(1一外），那么探究的焦点仍然是对 yvx 和/相对大 
小的检验。 



该模型会生成拟合统计量，并给出体《、 k 知的估 
计值。[ 32 ] 

针对表 5. 1中的定类数据，对数线性模型给出的估计值 
见表 5.2 J 33 ：! 独立卡方具有叠加性，因此，中介连接相对于直 
接路径的大小可以用下面的方程来近似地 检验： 

(Xmx +Xym) —Xyx = AXL-joWkiM. 〜 xj 
在这组数据中，= (191.57 + 540.09) - 
482.98 =248.68, 具有统计显著性，/» < 0.05(^ ia06 = 
3.841)，这意味着部分中介作用得到支持(某些变化是直接 



有助于决定类别数量的阀值，但要求样本规模较大。其他技 
术发展的初步结果表明，一种可能有效的方法是拟合一个对 
数线性模型并倒转其估计参数的协方差矩阵 （Kupek， 
2005) ，再将其输人结构方程模型。 

上述解决方案都是针对三个离散变量提出的。还有一 
个问题就是，当 X、Af 和 y 在测量形式上互不相同时（即其 
中的一个或两个变量是连续的，另外两个或另外一个变量是 
离散的），该如何解决？ logistic 回归是 logit 模型的一个延 
伸，也是针对离散型因变量的，但却允许加人连续型或离散 
型的预测变量。因此， logistic 回归能够将离散型的 Af 或 y 
建模为混合型预测变量的一个函数，但问题是，不同模型之 
间的整合很困难，即使都是 logistic 模型。更糟糕的是，如果 
一个内生变量是连续的(要求一个一般意义上的线性模型）， 
而另一个是离散的(要求一个 logit 模型或 logistic 回归），那 
么它们之间是不可比的,因为对路径的估计会通过相当不同 
的方法来实现，包括使用不同前提的技术和以不同的测量尺 
度为基础来估计参数（即线性与发生比的对数比较)。这种 
问题甚至也不能用由不同阶段的方程所组成的混合模型来 
解决，例如层级嵌套模型，因为线性(或 logit) 函数的输出结 
果会作为 logit (或线性)函数的输人条件。 

如前所述，对定类变量的主要考虑或担心是其固有的 
“信息损失”问题。这种信息损失已经被证明会导致对因子 
载荷(对定类变量而言)的低估和对卡方值的髙估 (DiStefa- 
no， 2002； Schumacker Beyerlein, 2000)。 请注意，这两种 
结果都在统计上犯了保守性的错误。一些模拟结果显示，基 
于定类变量与基于连续变量的结果具有相似性，除非是在二 



元取值变量的分布向相反的方向倾斜这种极端情形下 （Eth- 
ington， 1987)。 

使用定类数据的研究者的底线是，如果所有变量都是定 
类的，就可以按照方程 5. 5拟合一个对数线性模型。一般来 
说，如果X、 M 和 y 是任意一种定类变量与连续变量的混 
合，则 SEM 看似为首选的解决方法(用虚拟变量来表示定类 
变量），正如我们之前所演示的那样。 SEM 或许会损失某些 
关系，但它至少是一个保守的统计方法，它允许连续变量和 
离散变量的混合(在这一点上与 logistic 回归相同，但它还可 
以进一步与其他模型进行比较，而不需要在 SEM 和 logit 模 
型之间来回转换)。 



第 I 纵向数据 


研究者有时希望用重复测量或同一组个体数据 来&计 
中介模型。目前，已经有一些方法来应对这一新的考虑（参 
见 Cole & Maxwell* 2003； Judd. Kenny McClelland, 
2001)， 但重复测量数据也可以被轻易地纳人结构方程模型。 

图 5. 4显示了重复测量数据的实质——对X、 M 和 Y 
的测量在时点1和时点2上分别获得，研究者据此探究通常 
的结构参数,即估计X,— y,. x 2 — m 2 — 
y 2 、x 2 -y 2 „ 新的复杂性在于，对数据收集于同一组个体这 
一本质性特征来说，需要处理误差的结构性相关。具体而 
言，测量误差被允许在 x, 和 x 2 之间相关，即心 x , , v 现在需 
要估计而非设定为0。同样, M, 和从以及 y, 和6的测量 
误差也是如此，即^和^现在需要估计而非设定为 
0。这些具有相关性的误差作为参数被估计出来（其方差也 
要估计，以使协方差可变并且可被估计)。 





拟合如图 5.4 所示的模型的 LISREL 语句 如下： 





估计出来的参数捕捉了同样的概念建构在不同时间点 
上进行测量时，测量误差之间的相关性，这对我们来说可能 
是值得关注的，并且其本身确实有研究价值。例如,这些相 
关性都接近于0就可能意味着样本中的受访者没有刻意使 
他们的回答在不同的时间点上具有一致性，或者可能表示时 
点1上的测量经历对时点2上的测量影响很小，如此等等。 
典型的情形是，这些估计并不是我们主要的研究兴趣所在， 
相反，它们被纳人模型只是为了使结构路径系数的估计更准 



确，而后者才真正具有更大的理论意义。 

对于结构系数来说，研究者可以用方程 2. 4中的 Z 检验 
同时在时点1和时点2上对直接路径和间接路径进行比较。 
此外，还可以使用该方程来量化比较时点1和时点2上的直 
接路径。同样，研究者也可以比较两个时间点上的间接路 
径。然后，研究者会总结得出中介作用的程度是随时间变强 
了还是变弱了。如果比较不同时间点上的路径系数的 z 检 
验不显著，就表示中介结构可能没有发生变化，或者是样本 
规模太小以至于无法探测到某种变化。 







中介分析并非总是必须的。许多具有解释意义的过程 
都可以从它们所导致的结果中推导出来。如果要进行中介 
分析，就必须有一个坚实的理论基础，因为相关性数据与得 
出因果关系结论这一目标之间的关系会掺杂着某种模糊性。 
如果理论基础足够强，研究者就能够对替代性的模型进行实 
证检验并提出反对意见。例如，在这些替代性的模型中，变 
量的角色被交换了或者因果作用的方向被倒转了。 

如果要检验中介作用，可以按表 6. 1所给出的步骤进 
行。这里，我们也简要地对这些步骤进行一些归纳。用结构 
方程模型拟合一个模型，在这种建模过程中，直接路径和间 
接路径被同时拟合，目的是在排除了其他影响效应的情况下 
对每一个影响效应进行估计。当 X-M 和 M-y 两个路径 
系数都显著时，就意味着存在某种程度的中介作用。如果两 
个路径中有一个不显著（当然也包括两个都不显著这种情 
况)，分析就此停止，并得出不存在中介作用这一结论。 

如果显示出某种程度的中介作用（即间接路径的两段都 
显著)，并且中介路径的强度大于直接路径，则 Z 检验(方程 
2.4) 将是显著的。如果 Z 检验显著并且直接路径 X-Y 不显 
著，则中介作用是完全的。如果 2 检验和直接路径 x—Y 都 



表 6.1 用结构方程模型检驗中介作用的步骤摘罢 


1. 为了检验中介作用，用结构方程模型拟合一个模型，使直接路径和间接 
路径被同时拟合，目的是在排除了或统计上控制了其他影响效应的同 
时来估计这两个效应。 

a. 当 X—M 和 M-y 的系数都显著时，意味着存在“一些”中介效应。 

b. 如果两个路径中的任意一个不显著(或者两个都不显著)，就不存在 
中介作用，研究者应该就此停止。 

2. 计值以明确检验间接(中介)路径与直接路径的相对大小。各种结 
论如下： 

a. 如果 2 检验显著.但直接路径 X—y 不显著，則中介作用是完全& 

b. 如果 Z 检验和直接路径 x—y 都显著.則中介作用是部分的(并且， 

由 x 所解释的 y 的变化中，有较大一部分是通过间接路径而非直接 

路径实现的). 

a 如果 z 检验不显著，但直接路径 x—y 显著(记住间接的中介路径 x 
一 m 、 M-y 是显著的，否則我们就停止分 析了〉 ，則存在一个直接 
作用和部分的中介作用（并且，间接路径和直接路径的大小在统计 
上是相当的)。 

A 如果2检验和直接路径 x—y 都不显著，则不存在一个直接作用但 
存在部分的中介作用(并且间接路径和直接路径的大小在统计上是 
相当的）. 

3. 研究者可以报告的 结果： 

a. 给出路径系数 a、 6、 c 的估计值(参数估计和标准误)以及方程 2. 4 
中的 Z 检验。 

K 报告 SEM 软件包为“间接效应”提供的估计值以及“直接效应”或 
“总效应”的估计值。 

c 如果研究者想作出分类性的陈述，他/她可以总结说(根据结果〉中 
介作用是“不存在的”、“部分的”或是“完 全的' 

4. 理想的情形是，每一个槪念建构都应该用三个或更多的指标变置来 
测童。 

5. 核心的三变量中介关系在结构上应该是一个更大的分析 两的一 部分， 

该分析网至少容纳了一个額外的槪念建构，并将其作为X的一个原因 

或作为 X、M 或 y 的一个 结果。 

6. 研究者应该承认，有可能存在竞争性的模型，并且要检验几种可能的情 
形，例如至少要检理想的情形是加人 Q 来拟 
合这些竞争性的模型，目的是得到具备诊断性的拟合统计童.然而，即 
使只有 x、 m 和 y 三个变量，研究者也应该尝试替代性的模型，并且应 
该能够争辩说，替代性模型中的不同的参数估计比他们中意的模型差. 










如果 z 检验不显著，但直接路径 x-y 显著，则存在一个直接 
作用和部分的中介作用(并且，间接路径和直接路径的大小 
在统计上是相当的）。如果 z 检验和直接路径 x-y 都不显 
著，则不存在一个直接作用但存在部分的中介作用(并且，间 
接路径和直接路径的大小在统计上是相当的)。 t3S：I 

理想的情形是，每一个概念建构都应该用三个或更多的 
指标变量来测量 (Bagozzi Baumgartner, 1994)。此外，在 
理想状态下，中介作用应该嵌人一个更大的分系网中，该分 
析网至少容纳了一个额外的概念建构，并将其作为X的一个 
原因或作为X、 M 或 y 的一个结果。 
















EQS(http：//www. mvsoft. cmn/products. htm) 

















Sen. Structure 






对于本书所展示的其他模型，在输人数据之后，可使用 
画图工具绘制出概念建构和变量以及它们之间的连接箭头。 

首先，为模拟被纳人中介分析的测童模型, AMOS 的绘 
图(在点击 “run” 之前)应该类似于图 3.1( 尽管它适用于三个 
X、三个 M 和两个 y 的情况） 

第二，为了模拟有四个概念建构的模型(其中 Q 是X的 
一个原因）， AMOS 的绘图应该类似于图 4. 2(a) 

第三，对一个较长的关系链而言，例如 
除了这些箭头之外，还应该有 x-y 这一直接连接。 

第四，为了纳人一个调节变量，应该画出五个变量:足、 
x 2 、 不不(乘积项）、从、 y， 包括所有从 u 、 兄不到 M 
和 y 的连接以及一个 M-y 的连接。 

最后，对于图 5. 4所描绘的纵向中介作用，应该有以下 
连线:及― m ,、 X,— y, , m ,—y, 以及 x 2 — h 、x 2 —y 2 、 
M 2 -y 2 。 此外，使用者必须指出自相关连接，即 n 

m 】 —m 2 、 k 2 。 























型 2. 3 的拟合性指标记,并对它在两个模型之间的变化进行检验(例 
如， Cote, 2001, Lehmann, 2001). 遗憾的是，也有一些合理的批评意 
见反对用 R* 来评估棋型之间的比较。更重要的是，棋型在总体上解释 
了多少方差并不能准磽地反映囑些变童关系是强的 . 记这一信息只 
是对总的模式来说具有诊断性，但却过于宏现以至于不太有用. Baron 
和 Kenny( 1986) 也对多元共线性导致在检验方程 2. 3中的系数时统计 


















效力 有所臧 少表示 担心* 

[10] Preacher 和 Hayes(2004) 尖锐地问，为何对中介作用中的间接作用的 
显著性检验如此之少？对于不淸楚如何进行这种检验的研究者而言， 
MacKinnon 等人(2002〉作出了一个高度综合的介绍(见他们的表 1) 。 

[11] 见 Mattanah、Hancock 和 Brand(2004) 的著作.中介分析是如此常见， 
以至于它现在已成了荟萃分析的基勘(例如， Shadish，1996). 

[12] —些研究者正在探索如何使用自助法(一种不对分布作出任何假定的 
方法.参见 MacKinnon, Lockwood &• Williams， 2004〉，尤其是对小样 
本而言(因为基于多元正态性假设的统计量具有渐进性，即适用于非常 
大的样本，参见 Preacher & Hayes, 2006). MacKinnon, Warsnffl Dw- 
yer( 1995) 发现，对中介效应的估计在有50个(或稍多一些)观察个案 
的样本中表现得相当好，但当使用更大的样本 ( n > 500) 并且自变量被 
转换为二元取值变置时則不然（当一个连续变量被处理为二元取值变 
量时，会发生经典的信息损失问埋,导致检验变得更保守，这时就需要 
用大样本来强化数 据)。 

[14] Baron 和 Kenny (1986) 写道: “一般说来，测量误差的作用是减弱相关 
性程度，得到的估计值与不存在测量误差的时候相比更接近于0.例 
如，只有中介变置上的澜置误差会导致自变量对因变量的（直接)作用 
被高估, ”(1986:1177) 相反的情形是，如果X和 1T 都有涮量误差但 M 
没有，则中介路径可能会大于直接路径 • 

[15] Baron 和 Kenny (1986) 继续写 道:“ 解决信度问埋的一般方法是对概念 
達构进行多种搡作或使用多个测 置指标 ……研究者可以使用多元指标 
这一方法，并用潜变量结构建模方法来估计中介路径 ."(1986,1177) 

[16] 这一结果可能会使研究者误以为回归方法至少是一种“保守的”方法. 

然而，随后的结果会表明回归结果是具有误导性的，而 SEM 的结果才 

接近于研究总体的真实参败 Oaoobucd，Saldanha&- Deng. 2007) «这 
一 结果是重要的，因为传统上人们认为, SEM 需要大样本才能表现得 

较好(例如，«>200). SEM 的缺省计算方法和最常使用的方法是最大 

似然法，它给出的检验统计童在解释上具有渐进性（即随着 n 的增加， 
对得到的X 2 的解释会更加肯定），因此，问题就是在实践中 ， n 必须多 

大才能得到稳定的结果。此外，小样本会在收敛上有问題，其原因与在 


小样本中用一大 堆預* 变量来进行回归时会产生杂乱结果的原因相 
似。该研究表明， n 不需要大到200,相反，只要 n = 30 就足够了. 一» 
来说，该研究所检验的模型并不是非常复杂，但它们肯定涵盖了中介另 





















































































I 中介作用分析 
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